diff --git a/pages/students/2021/vladimir_ferko/README.md b/pages/students/2021/vladimir_ferko/README.md index 00e92933..7547a704 100644 --- a/pages/students/2021/vladimir_ferko/README.md +++ b/pages/students/2021/vladimir_ferko/README.md @@ -35,6 +35,18 @@ Stav: - Rozbehané Prodigy anotácie - Vyskúšaný model https://huggingface.co/kinit/slovakbert-sentiment-twitter +Úlohy: + +- [ ] Vykonať prieskum literatúry. Aké sú existujúce anglické a slovenské databázy na analýzu sentimentu? Ako sa klasifikuje sentiment pomocou neurónových sietí? Prieskum by mal mať niekoľko strán a mal by obsahovať odkazy na odbornú literatúru a iné zdroje. https://github.com/slovak-nlp/resources Tu pozrite zoznam modelov a datasetov pre sentiment. Nájdite aj niekoľko článkov na tému "crowdsourcing dataset for sentiment classification". Robte si písomné poznámky, použije sa to do BP. +- [ ] Vytvorte KEMT GIT repo. Nastavte tam synchronizáciu s KPI Git tak aby som mal prístup k zdrojovým kódom na stiahnutie a na tvorbu modelov. +- Preštudujte si zdrojové kódy https://github.com/hladek/hate-annot a skúste ich rozbehať na svojom počítači s Vašimi dátami. + +Zásobník úloh: + +- Čím skôr rozbehať anotácie sentimentu alebo hate speech medzi študentami. +- Zozbierané dáta využiť na natrénovanie modelu. + + Stretnutie 8.8. @@ -51,7 +63,7 @@ Zásobník úloh: - Finalizovať dátovú množinu (facebook alebo reddit) a anotačnú schému. - Pripraviť návod pre anotátorov -- Pripraviť webovú appku na sledevanie anotácií. +- Pripraviť webovú appku na sledovanie anotácií. - Natrénovať model. Stretnutie 29.6.2023