forked from KEMT/zpwiki
Update 'pages/students/2021/vladimir_ferko/README.md'
This commit is contained in:
parent
369543e606
commit
9a6c81083e
@ -35,6 +35,27 @@ Predbežné zadanie - úlohy na semester:
|
||||
- Možno anotovať nenávistnú reč. Toto konzultovať s p. Sokolovou.
|
||||
- Z nazbieraných dát zostavte a vyhodnoťte model
|
||||
|
||||
Stretnutie 23.1.2024
|
||||
|
||||
Stav:
|
||||
|
||||
- Práca iba na textovej časti.
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Pripravte dátovú množinu na anotovanie. Vyberte také dáta, ktoré obsahujú málo spamu a primerané množstvo "hatespeech". Môžete "nascrapovať" nové zdroje, také ktoré sú vhodnejšie.
|
||||
- Pripravte aplikáciu na anotovanie a skúste anotovať pár jednotiek. Zaznamenajte chyby anotačnej aplikácie.
|
||||
- Ak bude aplikácia v poriadku, anotujte viac.
|
||||
- Pokračujte v práci na textovej časti podľa inštrukcií nižšie.
|
||||
- Pokračujte v otvorených úlohách.
|
||||
|
||||
|
||||
Zásobník úloh:
|
||||
|
||||
- Prečistenie databázy na výskyt spamu: Pomocou modelu slovak-bert-mnlr identifikujte sémanticky podobné dokumenty. Ak má jeden dokument príliš veľa podobných, označte ho ako spam. Konzultovať s Stromko alebo Sopkovič. Asi bude treba použiť vektorový index.
|
||||
- Z anotovaných dát natrénujte model.
|
||||
|
||||
|
||||
Stretnutie 27.10.2023
|
||||
|
||||
Stav:
|
||||
|
Loading…
Reference in New Issue
Block a user