From 8b091a3c882dbbb5b0a783464bd36b24f972ca57 Mon Sep 17 00:00:00 2001 From: dano Date: Thu, 13 Nov 2025 09:09:13 +0000 Subject: [PATCH] Update pages/students/2021/matej_novotny/README.md --- pages/students/2021/matej_novotny/README.md | 3 ++- 1 file changed, 2 insertions(+), 1 deletion(-) diff --git a/pages/students/2021/matej_novotny/README.md b/pages/students/2021/matej_novotny/README.md index aee102b5a..a20df4212 100644 --- a/pages/students/2021/matej_novotny/README.md +++ b/pages/students/2021/matej_novotny/README.md @@ -31,12 +31,13 @@ Stretnutie 13.11.2025 - Dajte skripty na kemt git - Pripravte sadu vzorových url ktoré budú reprezentovať kategórie ktoré nás zaujímajú: blogy, eshopy, wikipedia, tematicka stranka, diskusie, kniha, clanok,reklama, organizácia, pornografia, správy. Z url získajte texty, každý text bude patriť do kategórie. Množinu rozdelte na trénovaciu a testovaciu. Zabezpečte aby materiály z jedného zdroja neboli v oboch naraz. - Na sade natrénujte a vyhodnotte klasifikátor. +- Pokračujte v práci na texte. Zásobník úloh: - Pomocou klasifikátorov analyzujte dostupné slovenské dáta. - Overte či je zoznam kategórií správny. -- Ak bude bert klasifikátor pomalý, vyskúšajte štatistické metódy. +- Ak bude bert klasifikátor pomalý, vyskúšajte štatistické metódy z NLTK. Stretnutie 9.10.2025