Update pages/students/2021/matej_novotny/README.md

This commit is contained in:
dano 2025-11-13 09:08:20 +00:00
parent c09c2a662f
commit 17e00c65b7

View File

@ -25,9 +25,18 @@ Stretnutie 13.11.2025
- Pripravený skript pre rozponávanie nenávisti. Pomocou HF transformers model. Natrénovaný vlastný model na kaggle. Treba na tom ešte pracovať. Založený run_classification z HF transformers examples. - Pripravený skript pre rozponávanie nenávisti. Pomocou HF transformers model. Natrénovaný vlastný model na kaggle. Treba na tom ešte pracovať. Založený run_classification z HF transformers examples.
Úlohy: Úlohy:
- Dajte skripty na kemt git - Dajte skripty na kemt git
- Pripravte sadu vzorových url ktoré budú reprezentovať kategórie ktoré nás zaujímajú: blogy, eshopy, wikipedia, tematicka stranka, diskusie, kniha, clanok,reklama, organizácia, pornografia, správy. Z url získajte texty, každý text bude patriť do kategórie. Množinu rozdelte na trénovaciu a testovaciu. Zabezpečte aby materiály z jedného zdroja neboli v oboch naraz.
- Na sade natrénujte a vyhodnotte klasifikátor.
Zásobník úloh:
- Pomocou klasifikátorov analyzujte dostupné slovenské dáta.
- Overte či je zoznam kategórií správny.
- Ak bude bert klasifikátor pomalý, vyskúšajte štatistické metódy.
Stretnutie 9.10.2025 Stretnutie 9.10.2025