forked from KEMT/zpwiki
Update pages/students/2021/matej_novotny/README.md
This commit is contained in:
parent
d0c3ab425e
commit
4623c3daf1
@ -16,11 +16,11 @@ Klasifikácia webových dát pre lepšie jazykové modelovanie
|
||||
|
||||
Zadanie:
|
||||
|
||||
- Vypracujte prehľad súčasných prístupov a nástrojov na klasifikáciu webových dát podľa typu a na detekciu nenávistného obsahu.
|
||||
- Navrhnite a implementujte systém, ktorý automaticky roztriedi webové texty podľa uvedených typov a domén a zároveň vyhodnotí ich úroveň nenávisti pomocou trénovaného alebo predtrénovaného modelu.
|
||||
- Zostavte kvalitný všeobecný a tematický korpus vhodný na trénovanie jazykového modelu.
|
||||
- Štatisticky analyzujte výskyt jednotlivých kategórií textu a výskyt potenciálne nenávistného obsahu.
|
||||
- Slovne vyhodnoťte navrhnutý systém a navrhnite ďalšie zlepšenia pre zvýšenie kvality trénovacích dát.
|
||||
1. Vypracujte prehľad súčasných prístupov a nástrojov na klasifikáciu webových dát podľa typu a na detekciu nenávistného obsahu.
|
||||
2. Navrhnite a implementujte systém, ktorý automaticky roztriedi webové texty podľa uvedených typov a domén a zároveň vyhodnotí ich úroveň nenávisti.
|
||||
3. Zostavte kvalitný všeobecný a tematický korpus vhodný na trénovanie jazykového modelu.
|
||||
4. Štatisticky analyzujte výskyt jednotlivých kategórií textov a výskyt potenciálneho nenávistného obsahu.
|
||||
5. Slovne vyhodnoťte navrhnutý systém a navrhnite ďalšie zlepšenia pre zvýšenie kvality trénovacích dát.
|
||||
|
||||
|
||||
|
||||
|
||||
Loading…
Reference in New Issue
Block a user