Update pages/students/2021/matej_novotny/README.md

This commit is contained in:
dano 2025-11-13 09:09:13 +00:00
parent 17e00c65b7
commit 8b091a3c88

View File

@ -31,12 +31,13 @@ Stretnutie 13.11.2025
- Dajte skripty na kemt git
- Pripravte sadu vzorových url ktoré budú reprezentovať kategórie ktoré nás zaujímajú: blogy, eshopy, wikipedia, tematicka stranka, diskusie, kniha, clanok,reklama, organizácia, pornografia, správy. Z url získajte texty, každý text bude patriť do kategórie. Množinu rozdelte na trénovaciu a testovaciu. Zabezpečte aby materiály z jedného zdroja neboli v oboch naraz.
- Na sade natrénujte a vyhodnotte klasifikátor.
- Pokračujte v práci na texte.
Zásobník úloh:
- Pomocou klasifikátorov analyzujte dostupné slovenské dáta.
- Overte či je zoznam kategórií správny.
- Ak bude bert klasifikátor pomalý, vyskúšajte štatistické metódy.
- Ak bude bert klasifikátor pomalý, vyskúšajte štatistické metódy z NLTK.
Stretnutie 9.10.2025