forked from KEMT/zpwiki
Update 'pages/students/2021/vladimir_ferko/README.md'
This commit is contained in:
parent
9764b95549
commit
15f9bc7e23
@ -27,6 +27,8 @@ Názov: Anotácia a vyhodnotenie slovenskej databázy nenávistnej reči
|
|||||||
5. Štatisticky analyzujte výskyt anotovanej nenávistnej reči v diskusiách.
|
5. Štatisticky analyzujte výskyt anotovanej nenávistnej reči v diskusiách.
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
Predbežné zadanie - úlohy na semester:
|
Predbežné zadanie - úlohy na semester:
|
||||||
|
|
||||||
- Vytvoriť slovenskú databázu diskusií. Databáza by mala byť prezentovateľná na konferencii a použiteľná pre rozpoznávanie nenávistnej reči.
|
- Vytvoriť slovenskú databázu diskusií. Databáza by mala byť prezentovateľná na konferencii a použiteľná pre rozpoznávanie nenávistnej reči.
|
||||||
@ -35,6 +37,23 @@ Predbežné zadanie - úlohy na semester:
|
|||||||
- Možno anotovať nenávistnú reč. Toto konzultovať s p. Sokolovou.
|
- Možno anotovať nenávistnú reč. Toto konzultovať s p. Sokolovou.
|
||||||
- Z nazbieraných dát zostavte a vyhodnoťte model
|
- Z nazbieraných dát zostavte a vyhodnoťte model
|
||||||
|
|
||||||
|
Stretnutie 8.2.2024
|
||||||
|
|
||||||
|
Stav:
|
||||||
|
|
||||||
|
- Práca na identifikácii podobných príspevkov pomocou embeddingov. V matici sa vyhľadá každý dokument, ktorého kosínusová podobnosť je väčšia ako konštanta.
|
||||||
|
|
||||||
|
Úlohy:
|
||||||
|
|
||||||
|
- Získajte dáta z íných zdrojov, vhodné na anotáciu. Kritériá sú: miera výskytu nenávistnej reči, druh nenávistnej reči a legálne nástrahy (osobné dáta, licencia).
|
||||||
|
|
||||||
|
Momentálne máme:
|
||||||
|
- Facebook, rôzne profily. Problém je výskyt spamu.
|
||||||
|
|
||||||
|
Možné zdroje:
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
Stretnutie 23.1.2024
|
Stretnutie 23.1.2024
|
||||||
|
|
||||||
Stav:
|
Stav:
|
||||||
|
Loading…
Reference in New Issue
Block a user