From 15f9bc7e23988961524916b235158cf7421ff53a Mon Sep 17 00:00:00 2001 From: dano Date: Thu, 8 Feb 2024 12:00:16 +0000 Subject: [PATCH] Update 'pages/students/2021/vladimir_ferko/README.md' --- pages/students/2021/vladimir_ferko/README.md | 19 +++++++++++++++++++ 1 file changed, 19 insertions(+) diff --git a/pages/students/2021/vladimir_ferko/README.md b/pages/students/2021/vladimir_ferko/README.md index 9f8765c3a3..05ade642aa 100644 --- a/pages/students/2021/vladimir_ferko/README.md +++ b/pages/students/2021/vladimir_ferko/README.md @@ -27,6 +27,8 @@ Názov: Anotácia a vyhodnotenie slovenskej databázy nenávistnej reči 5. Štatisticky analyzujte výskyt anotovanej nenávistnej reči v diskusiách. + + Predbežné zadanie - úlohy na semester: - Vytvoriť slovenskú databázu diskusií. Databáza by mala byť prezentovateľná na konferencii a použiteľná pre rozpoznávanie nenávistnej reči. @@ -35,6 +37,23 @@ Predbežné zadanie - úlohy na semester: - Možno anotovať nenávistnú reč. Toto konzultovať s p. Sokolovou. - Z nazbieraných dát zostavte a vyhodnoťte model +Stretnutie 8.2.2024 + +Stav: + +- Práca na identifikácii podobných príspevkov pomocou embeddingov. V matici sa vyhľadá každý dokument, ktorého kosínusová podobnosť je väčšia ako konštanta. + +Úlohy: + +- Získajte dáta z íných zdrojov, vhodné na anotáciu. Kritériá sú: miera výskytu nenávistnej reči, druh nenávistnej reči a legálne nástrahy (osobné dáta, licencia). + +Momentálne máme: +- Facebook, rôzne profily. Problém je výskyt spamu. + +Možné zdroje: + + + Stretnutie 23.1.2024 Stav: