diff --git a/pages/students/2021/matej_novotny/README.md b/pages/students/2021/matej_novotny/README.md index bfe014c5..aee102b5 100644 --- a/pages/students/2021/matej_novotny/README.md +++ b/pages/students/2021/matej_novotny/README.md @@ -25,9 +25,18 @@ Stretnutie 13.11.2025 - Pripravený skript pre rozponávanie nenávisti. Pomocou HF transformers model. Natrénovaný vlastný model na kaggle. Treba na tom ešte pracovať. Založený run_classification z HF transformers examples. + Úlohy: - Dajte skripty na kemt git +- Pripravte sadu vzorových url ktoré budú reprezentovať kategórie ktoré nás zaujímajú: blogy, eshopy, wikipedia, tematicka stranka, diskusie, kniha, clanok,reklama, organizácia, pornografia, správy. Z url získajte texty, každý text bude patriť do kategórie. Množinu rozdelte na trénovaciu a testovaciu. Zabezpečte aby materiály z jedného zdroja neboli v oboch naraz. +- Na sade natrénujte a vyhodnotte klasifikátor. + +Zásobník úloh: + +- Pomocou klasifikátorov analyzujte dostupné slovenské dáta. +- Overte či je zoznam kategórií správny. +- Ak bude bert klasifikátor pomalý, vyskúšajte štatistické metódy. Stretnutie 9.10.2025