Update pages/students/2021/matej_novotny/README.md
This commit is contained in:
parent
17e00c65b7
commit
8b091a3c88
@ -31,12 +31,13 @@ Stretnutie 13.11.2025
|
||||
- Dajte skripty na kemt git
|
||||
- Pripravte sadu vzorových url ktoré budú reprezentovať kategórie ktoré nás zaujímajú: blogy, eshopy, wikipedia, tematicka stranka, diskusie, kniha, clanok,reklama, organizácia, pornografia, správy. Z url získajte texty, každý text bude patriť do kategórie. Množinu rozdelte na trénovaciu a testovaciu. Zabezpečte aby materiály z jedného zdroja neboli v oboch naraz.
|
||||
- Na sade natrénujte a vyhodnotte klasifikátor.
|
||||
- Pokračujte v práci na texte.
|
||||
|
||||
Zásobník úloh:
|
||||
|
||||
- Pomocou klasifikátorov analyzujte dostupné slovenské dáta.
|
||||
- Overte či je zoznam kategórií správny.
|
||||
- Ak bude bert klasifikátor pomalý, vyskúšajte štatistické metódy.
|
||||
- Ak bude bert klasifikátor pomalý, vyskúšajte štatistické metódy z NLTK.
|
||||
|
||||
Stretnutie 9.10.2025
|
||||
|
||||
|
||||
Loading…
Reference in New Issue
Block a user