diff --git a/pages/students/2022/tetiana_mohorian/README.md b/pages/students/2022/tetiana_mohorian/README.md index c6537153..bb10c9f7 100644 --- a/pages/students/2022/tetiana_mohorian/README.md +++ b/pages/students/2022/tetiana_mohorian/README.md @@ -26,25 +26,45 @@ Rozpoznávanie nenávistnej reči pomocou veľkých jazykových modelov. - Aplikujte existujúci model na úlohu detekcie nenávistnej reči. - Na adaptáciu použite "prompting" a "LORA". - Vyhodnotte model pomocou [overovacej množiny](https://huggingface.co/datasets/TUKE-KEMT/hate_speech_slovak). -c + +Stretnutie 18.10.2024 + +Stav: + +- Urobené 3 prehľadové tabuľky s modelmi - architektúra, presnosť, multilinguaglita. +- Pozretá kniha DDIP3 a d2dl. Poznámky na 20 strán. +- Nainštalovaná OLLama, Transformers, vyskúšaný Mistral. +- Urobené všetko. + +Úlohy: + +- Pokračujte v písaní bakalárskej práce. Postupujte od definície úlohy, prehľad súčasného stavu, Vaše riešenie, experimenty a závery. Používajte odkazy na odbornú literatúru (vedecké články cez Google Scholar). +- Navrhnite promt (može byť aj viac rôznych) pre veľký jazykový model pre detekciu nenávistnej reči. +- Pomocou množiny vyhodnotte model pre detekciu HS v zero shot alebo v few shot scenári. Na vyhodnotenie použite metriku Precision-Recall-F1. +- Oboznámte sa ako funguje overenie veľkých jazykových modelov pomocu Eleuther lm-evaluation-harness. + + +Zásobník úloh: + +- Dotrénujte vybrané modely na úlohu detekcie nenávistnej reči. Model bude vykonávať binárnu klasifikáciu. +- Pripravte skript pre overenie LLM na úlohe rozpoznávanie nenávistnej reči. +- Pripravte postup pre overenie pomocu existujúceho frameworku pre overenie. Stretnutie 3.10.2024 - - Úlohy: -- Oboznámte sa s existujúcimi veľkými jazykovými modelmi - uzatvorenými aj otvorenými. Urobte si poznámky a napíšte prehľad. -- Prejdite si knihu Dive Deep into Python 3. -- Prečítajte si knihu https://d2l.ai/ a napíšte si poznámky. -- Zistite čo je to "prompting", a "few shot learning". Napíšte si poznámky. -- Oboznámte sa s OPEN AI Python API. -- Nainštalujte si prostredie Anaconda. -- Nainštalujte si Pytorch, a huggingface transformers a oboznámte sa ako funguje táto knižnica. -- Nainštalujte si prostredie OLLAMA a vyskúšajte lokálne jazykové modely +- [x] Oboznámte sa s existujúcimi veľkými jazykovými modelmi - uzatvorenými aj otvorenými. Urobte si poznámky a napíšte prehľad. +- [x] Prejdite si knihu Dive Deep into Python 3. +- [x] Prečítajte si knihu https://d2l.ai/ a napíšte si poznámky. +- [x] Zistite čo je to "prompting", a "few shot learning". Napíšte si poznámky. +- [x] Oboznámte sa s OPEN AI Python API. +- [x] Nainštalujte si prostredie Anaconda. +- [x] Nainštalujte si Pytorch, a huggingface transformers a oboznámte sa ako funguje táto knižnica. +- [x] Nainštalujte si prostredie OLLAMA a vyskúšajte lokálne jazykové modely Zásobník úloh: -- Nainštalujte si knižnicu LangChain a pozrite si ako fungujú [ChatModely](https://python.langchain.com/docs/modules/model_io/chat/) +- [x] Nainštalujte si knižnicu LangChain a pozrite si ako fungujú [ChatModely](https://python.langchain.com/docs/modules/model_io/chat/)