diff --git a/pages/students/2020/matus_suchanic/README.md b/pages/students/2020/matus_suchanic/README.md index ca5604bd..ad9ba02f 100644 --- a/pages/students/2020/matus_suchanic/README.md +++ b/pages/students/2020/matus_suchanic/README.md @@ -13,23 +13,31 @@ rok začiatku štúdia: 2020 Téma: Vyhľadávanie na slovenskej Wikipédii -Úloha: Implementovať jednoduchý systém na indexovanie článkov na slovenskej wikipédii a ich vyhľadávanie. +Úloha: +- Implementovať jednoduchý systém na indexovanie článkov na slovenskej wikipédii a ich vyhľadávanie. +- alebo Implementujte systém na kategorizáciu slovenských novinových článkov. Práca súvisí s: - [DP Michal Stromko](/students/2019/michal_stromko) - [BP Matej Kobyľan](/students/2020/matej_kobylan) -Nový návrh: +Stretnutie 30.9.2022: -- Implementujte systém na kategorizáciu slovenských novinových článkov. +Stav: + +- Je nainštalovaný Anaconda a HF transformers. Úlohy: -- Prečítajte si článok "Comparison of Statistical Algorithms and Deep Learning for Slovak Document Classification" https://ieeexplore.ieee.org/abstract/document/9869155 dostupný z TUKE siete. -- Napíšte na pol strany čo ste sa dozvedeli. -- Vypracujte prehľad novej odbornej literatúry na tému Text Categorization. Zistite aké štatistické a neurónové metódy sa používajú. Ako základ Vám poslúži článok vyššie. +- Vypracujte prehľad novej odbornej literatúry na tému Text Categorization. Zistite aké štatistické a neurónové metódy sa používajú. Ako základ Vám poslúži článok nižšie. +- Prečítajte si článok "Comparison of Statistical Algorithms and Deep Learning for Slovak Document Classification" https://ieeexplore.ieee.org/abstract/document/9869155 dostupný z TUKE siete. Napíšte na pol strany čo ste sa dozvedeli. + - Zopakujte experiment s klasifikáciou slovenských novinových článkov. Použite knižnicu HF transformers, Skripty Vám dodá vedúci. Použite knižnicu HF transformers, Skripty Vám dodá vedúci. Použite "Slovak Categorized News Corpus" na trénovanie. + + +Zásobník úloh: + - Pripravte skript, ktorý bude vedieť klasifikovať neznáme články uložené v databáze. # Vedecký projekt 2022