This commit is contained in:
Daniel Hládek 2022-09-29 09:57:44 +02:00
parent 3360fc9987
commit f0b0a292de
2 changed files with 11 additions and 1 deletions

View File

@ -20,7 +20,17 @@ Práca súvisí s:
- [DP Michal Stromko](/students/2019/michal_stromko) - [DP Michal Stromko](/students/2019/michal_stromko)
- [BP Matej Kobyľan](/students/2020/matej_kobylan) - [BP Matej Kobyľan](/students/2020/matej_kobylan)
Nový návrh:
- Implementujte systém na kategorizáciu slovenských novinových článkov.
Úlohy:
- Prečítajte si článok "Comparison of Statistical Algorithms and Deep Learning for Slovak Document Classification" https://ieeexplore.ieee.org/abstract/document/9869155 dostupný z TUKE siete.
- Napíšte na pol strany čo ste sa dozvedeli.
- Vypracujte prehľad novej odbornej literatúry na tému Text Categorization. Zistite aké štatistické a neurónové metódy sa používajú. Ako základ Vám poslúži článok vyššie.
- Zopakujte experiment s klasifikáciou slovenských novinových článkov. Použite knižnicu HF transformers, Skripty Vám dodá vedúci. Použite knižnicu HF transformers, Skripty Vám dodá vedúci. Použite "Slovak Categorized News Corpus" na trénovanie.
- Pripravte skript, ktorý bude vedieť klasifikovať neznáme články uložené v databáze.
# Vedecký projekt 2022 # Vedecký projekt 2022

View File

@ -19,5 +19,5 @@ Na naučenie neurónovej siete použite webové diskusie.
Zvážiť inú tému: Zvážiť inú tému:
- Konverzačný agent pre prezentáciu výsledkov spracovnaia prirodzeného jazyka. - Konverzačný agent pre prezentáciu výsledkov spracovnania prirodzeného jazyka.
- Oprava preklepov v slovenskom jazyku. - Oprava preklepov v slovenskom jazyku.