From 4623c3daf181087ab15dcf4c375af60ddd5fdc98 Mon Sep 17 00:00:00 2001 From: dano Date: Thu, 15 Jan 2026 15:01:38 +0000 Subject: [PATCH] Update pages/students/2021/matej_novotny/README.md --- pages/students/2021/matej_novotny/README.md | 10 +++++----- 1 file changed, 5 insertions(+), 5 deletions(-) diff --git a/pages/students/2021/matej_novotny/README.md b/pages/students/2021/matej_novotny/README.md index a2812d49b..43f6ddc71 100644 --- a/pages/students/2021/matej_novotny/README.md +++ b/pages/students/2021/matej_novotny/README.md @@ -16,11 +16,11 @@ Klasifikácia webových dát pre lepšie jazykové modelovanie Zadanie: -- Vypracujte prehľad súčasných prístupov a nástrojov na klasifikáciu webových dát podľa typu a na detekciu nenávistného obsahu. -- Navrhnite a implementujte systém, ktorý automaticky roztriedi webové texty podľa uvedených typov a domén a zároveň vyhodnotí ich úroveň nenávisti pomocou trénovaného alebo predtrénovaného modelu. -- Zostavte kvalitný všeobecný a tematický korpus vhodný na trénovanie jazykového modelu. -- Štatisticky analyzujte výskyt jednotlivých kategórií textu a výskyt potenciálne nenávistného obsahu. -- Slovne vyhodnoťte navrhnutý systém a navrhnite ďalšie zlepšenia pre zvýšenie kvality trénovacích dát. +1. Vypracujte prehľad súčasných prístupov a nástrojov na klasifikáciu webových dát podľa typu a na detekciu nenávistného obsahu. +2. Navrhnite a implementujte systém, ktorý automaticky roztriedi webové texty podľa uvedených typov a domén a zároveň vyhodnotí ich úroveň nenávisti. +3. Zostavte kvalitný všeobecný a tematický korpus vhodný na trénovanie jazykového modelu. +4. Štatisticky analyzujte výskyt jednotlivých kategórií textov a výskyt potenciálneho nenávistného obsahu. +5. Slovne vyhodnoťte navrhnutý systém a navrhnite ďalšie zlepšenia pre zvýšenie kvality trénovacích dát.