forked from KEMT/zpwiki
Update 'pages/students/2021/vladimir_ferko/README.md'
This commit is contained in:
parent
9764b95549
commit
15f9bc7e23
@ -27,6 +27,8 @@ Názov: Anotácia a vyhodnotenie slovenskej databázy nenávistnej reči
|
||||
5. Štatisticky analyzujte výskyt anotovanej nenávistnej reči v diskusiách.
|
||||
|
||||
|
||||
|
||||
|
||||
Predbežné zadanie - úlohy na semester:
|
||||
|
||||
- Vytvoriť slovenskú databázu diskusií. Databáza by mala byť prezentovateľná na konferencii a použiteľná pre rozpoznávanie nenávistnej reči.
|
||||
@ -35,6 +37,23 @@ Predbežné zadanie - úlohy na semester:
|
||||
- Možno anotovať nenávistnú reč. Toto konzultovať s p. Sokolovou.
|
||||
- Z nazbieraných dát zostavte a vyhodnoťte model
|
||||
|
||||
Stretnutie 8.2.2024
|
||||
|
||||
Stav:
|
||||
|
||||
- Práca na identifikácii podobných príspevkov pomocou embeddingov. V matici sa vyhľadá každý dokument, ktorého kosínusová podobnosť je väčšia ako konštanta.
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Získajte dáta z íných zdrojov, vhodné na anotáciu. Kritériá sú: miera výskytu nenávistnej reči, druh nenávistnej reči a legálne nástrahy (osobné dáta, licencia).
|
||||
|
||||
Momentálne máme:
|
||||
- Facebook, rôzne profily. Problém je výskyt spamu.
|
||||
|
||||
Možné zdroje:
|
||||
|
||||
|
||||
|
||||
Stretnutie 23.1.2024
|
||||
|
||||
Stav:
|
||||
|
Loading…
Reference in New Issue
Block a user