forked from KEMT/zpwiki
Update pages/students/2021/matej_novotny/README.md
This commit is contained in:
parent
c09c2a662f
commit
17e00c65b7
@ -25,9 +25,18 @@ Stretnutie 13.11.2025
|
||||
|
||||
- Pripravený skript pre rozponávanie nenávisti. Pomocou HF transformers model. Natrénovaný vlastný model na kaggle. Treba na tom ešte pracovať. Založený run_classification z HF transformers examples.
|
||||
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Dajte skripty na kemt git
|
||||
- Pripravte sadu vzorových url ktoré budú reprezentovať kategórie ktoré nás zaujímajú: blogy, eshopy, wikipedia, tematicka stranka, diskusie, kniha, clanok,reklama, organizácia, pornografia, správy. Z url získajte texty, každý text bude patriť do kategórie. Množinu rozdelte na trénovaciu a testovaciu. Zabezpečte aby materiály z jedného zdroja neboli v oboch naraz.
|
||||
- Na sade natrénujte a vyhodnotte klasifikátor.
|
||||
|
||||
Zásobník úloh:
|
||||
|
||||
- Pomocou klasifikátorov analyzujte dostupné slovenské dáta.
|
||||
- Overte či je zoznam kategórií správny.
|
||||
- Ak bude bert klasifikátor pomalý, vyskúšajte štatistické metódy.
|
||||
|
||||
Stretnutie 9.10.2025
|
||||
|
||||
|
||||
Loading…
Reference in New Issue
Block a user