diff --git a/pages/students/2021/vladimir_ferko/README.md b/pages/students/2021/vladimir_ferko/README.md index 9f8765c3a3..05ade642aa 100644 --- a/pages/students/2021/vladimir_ferko/README.md +++ b/pages/students/2021/vladimir_ferko/README.md @@ -27,6 +27,8 @@ Názov: Anotácia a vyhodnotenie slovenskej databázy nenávistnej reči 5. Štatisticky analyzujte výskyt anotovanej nenávistnej reči v diskusiách. + + Predbežné zadanie - úlohy na semester: - Vytvoriť slovenskú databázu diskusií. Databáza by mala byť prezentovateľná na konferencii a použiteľná pre rozpoznávanie nenávistnej reči. @@ -35,6 +37,23 @@ Predbežné zadanie - úlohy na semester: - Možno anotovať nenávistnú reč. Toto konzultovať s p. Sokolovou. - Z nazbieraných dát zostavte a vyhodnoťte model +Stretnutie 8.2.2024 + +Stav: + +- Práca na identifikácii podobných príspevkov pomocou embeddingov. V matici sa vyhľadá každý dokument, ktorého kosínusová podobnosť je väčšia ako konštanta. + +Úlohy: + +- Získajte dáta z íných zdrojov, vhodné na anotáciu. Kritériá sú: miera výskytu nenávistnej reči, druh nenávistnej reči a legálne nástrahy (osobné dáta, licencia). + +Momentálne máme: +- Facebook, rôzne profily. Problém je výskyt spamu. + +Možné zdroje: + + + Stretnutie 23.1.2024 Stav: