diff --git a/pages/students/2021/matej_novotny/README.md b/pages/students/2021/matej_novotny/README.md index aee102b5..a20df421 100644 --- a/pages/students/2021/matej_novotny/README.md +++ b/pages/students/2021/matej_novotny/README.md @@ -31,12 +31,13 @@ Stretnutie 13.11.2025 - Dajte skripty na kemt git - Pripravte sadu vzorových url ktoré budú reprezentovať kategórie ktoré nás zaujímajú: blogy, eshopy, wikipedia, tematicka stranka, diskusie, kniha, clanok,reklama, organizácia, pornografia, správy. Z url získajte texty, každý text bude patriť do kategórie. Množinu rozdelte na trénovaciu a testovaciu. Zabezpečte aby materiály z jedného zdroja neboli v oboch naraz. - Na sade natrénujte a vyhodnotte klasifikátor. +- Pokračujte v práci na texte. Zásobník úloh: - Pomocou klasifikátorov analyzujte dostupné slovenské dáta. - Overte či je zoznam kategórií správny. -- Ak bude bert klasifikátor pomalý, vyskúšajte štatistické metódy. +- Ak bude bert klasifikátor pomalý, vyskúšajte štatistické metódy z NLTK. Stretnutie 9.10.2025