Update 'pages/students/2021/vladimir_ferko/README.md'

This commit is contained in:
dano 2024-02-08 12:00:16 +00:00
parent 9764b95549
commit 15f9bc7e23

View File

@ -27,6 +27,8 @@ Názov: Anotácia a vyhodnotenie slovenskej databázy nenávistnej reči
5. Štatisticky analyzujte výskyt anotovanej nenávistnej reči v diskusiách. 5. Štatisticky analyzujte výskyt anotovanej nenávistnej reči v diskusiách.
Predbežné zadanie - úlohy na semester: Predbežné zadanie - úlohy na semester:
- Vytvoriť slovenskú databázu diskusií. Databáza by mala byť prezentovateľná na konferencii a použiteľná pre rozpoznávanie nenávistnej reči. - Vytvoriť slovenskú databázu diskusií. Databáza by mala byť prezentovateľná na konferencii a použiteľná pre rozpoznávanie nenávistnej reči.
@ -35,6 +37,23 @@ Predbežné zadanie - úlohy na semester:
- Možno anotovať nenávistnú reč. Toto konzultovať s p. Sokolovou. - Možno anotovať nenávistnú reč. Toto konzultovať s p. Sokolovou.
- Z nazbieraných dát zostavte a vyhodnoťte model - Z nazbieraných dát zostavte a vyhodnoťte model
Stretnutie 8.2.2024
Stav:
- Práca na identifikácii podobných príspevkov pomocou embeddingov. V matici sa vyhľadá každý dokument, ktorého kosínusová podobnosť je väčšia ako konštanta.
Úlohy:
- Získajte dáta z íných zdrojov, vhodné na anotáciu. Kritériá sú: miera výskytu nenávistnej reči, druh nenávistnej reči a legálne nástrahy (osobné dáta, licencia).
Momentálne máme:
- Facebook, rôzne profily. Problém je výskyt spamu.
Možné zdroje:
Stretnutie 23.1.2024 Stretnutie 23.1.2024
Stav: Stav: