Update 'pages/students/2020/matus_suchanic/README.md'

This commit is contained in:
dano 2022-09-30 10:55:36 +00:00
parent 3bfbe0d902
commit 41b08e6dae

View File

@ -13,23 +13,31 @@ rok začiatku štúdia: 2020
Téma: Vyhľadávanie na slovenskej Wikipédii
Úloha: Implementovať jednoduchý systém na indexovanie článkov na slovenskej wikipédii a ich vyhľadávanie.
Úloha:
- Implementovať jednoduchý systém na indexovanie článkov na slovenskej wikipédii a ich vyhľadávanie.
- alebo Implementujte systém na kategorizáciu slovenských novinových článkov.
Práca súvisí s:
- [DP Michal Stromko](/students/2019/michal_stromko)
- [BP Matej Kobyľan](/students/2020/matej_kobylan)
Nový návrh:
Stretnutie 30.9.2022:
- Implementujte systém na kategorizáciu slovenských novinových článkov.
Stav:
- Je nainštalovaný Anaconda a HF transformers.
Úlohy:
- Prečítajte si článok "Comparison of Statistical Algorithms and Deep Learning for Slovak Document Classification" https://ieeexplore.ieee.org/abstract/document/9869155 dostupný z TUKE siete.
- Napíšte na pol strany čo ste sa dozvedeli.
- Vypracujte prehľad novej odbornej literatúry na tému Text Categorization. Zistite aké štatistické a neurónové metódy sa používajú. Ako základ Vám poslúži článok vyššie.
- Vypracujte prehľad novej odbornej literatúry na tému Text Categorization. Zistite aké štatistické a neurónové metódy sa používajú. Ako základ Vám poslúži článok nižšie.
- Prečítajte si článok "Comparison of Statistical Algorithms and Deep Learning for Slovak Document Classification" https://ieeexplore.ieee.org/abstract/document/9869155 dostupný z TUKE siete. Napíšte na pol strany čo ste sa dozvedeli.
- Zopakujte experiment s klasifikáciou slovenských novinových článkov. Použite knižnicu HF transformers, Skripty Vám dodá vedúci. Použite knižnicu HF transformers, Skripty Vám dodá vedúci. Použite "Slovak Categorized News Corpus" na trénovanie.
Zásobník úloh:
- Pripravte skript, ktorý bude vedieť klasifikovať neznáme články uložené v databáze.
# Vedecký projekt 2022