Update pages/students/2021/matej_novotny/README.md

This commit is contained in:
dano 2026-01-15 15:01:38 +00:00
parent d0c3ab425e
commit 4623c3daf1

View File

@ -16,11 +16,11 @@ Klasifikácia webových dát pre lepšie jazykové modelovanie
Zadanie: Zadanie:
- Vypracujte prehľad súčasných prístupov a nástrojov na klasifikáciu webových dát podľa typu a na detekciu nenávistného obsahu. 1. Vypracujte prehľad súčasných prístupov a nástrojov na klasifikáciu webových dát podľa typu a na detekciu nenávistného obsahu.
- Navrhnite a implementujte systém, ktorý automaticky roztriedi webové texty podľa uvedených typov a domén a zároveň vyhodnotí ich úroveň nenávisti pomocou trénovaného alebo predtrénovaného modelu. 2. Navrhnite a implementujte systém, ktorý automaticky roztriedi webové texty podľa uvedených typov a domén a zároveň vyhodnotí ich úroveň nenávisti.
- Zostavte kvalitný všeobecný a tematický korpus vhodný na trénovanie jazykového modelu. 3. Zostavte kvalitný všeobecný a tematický korpus vhodný na trénovanie jazykového modelu.
- Štatisticky analyzujte výskyt jednotlivých kategórií textu a výskyt potenciálne nenávistného obsahu. 4. Štatisticky analyzujte výskyt jednotlivých kategórií textov a výskyt potenciálneho nenávistného obsahu.
- Slovne vyhodnoťte navrhnutý systém a navrhnite ďalšie zlepšenia pre zvýšenie kvality trénovacích dát. 5. Slovne vyhodnoťte navrhnutý systém a navrhnite ďalšie zlepšenia pre zvýšenie kvality trénovacích dát.