forked from KEMT/zpwiki
Update 'pages/students/2020/matus_suchanic/README.md'
This commit is contained in:
parent
3bfbe0d902
commit
41b08e6dae
@ -13,23 +13,31 @@ rok začiatku štúdia: 2020
|
||||
|
||||
Téma: Vyhľadávanie na slovenskej Wikipédii
|
||||
|
||||
Úloha: Implementovať jednoduchý systém na indexovanie článkov na slovenskej wikipédii a ich vyhľadávanie.
|
||||
Úloha:
|
||||
- Implementovať jednoduchý systém na indexovanie článkov na slovenskej wikipédii a ich vyhľadávanie.
|
||||
- alebo Implementujte systém na kategorizáciu slovenských novinových článkov.
|
||||
|
||||
Práca súvisí s:
|
||||
|
||||
- [DP Michal Stromko](/students/2019/michal_stromko)
|
||||
- [BP Matej Kobyľan](/students/2020/matej_kobylan)
|
||||
|
||||
Nový návrh:
|
||||
Stretnutie 30.9.2022:
|
||||
|
||||
- Implementujte systém na kategorizáciu slovenských novinových článkov.
|
||||
Stav:
|
||||
|
||||
- Je nainštalovaný Anaconda a HF transformers.
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Prečítajte si článok "Comparison of Statistical Algorithms and Deep Learning for Slovak Document Classification" https://ieeexplore.ieee.org/abstract/document/9869155 dostupný z TUKE siete.
|
||||
- Napíšte na pol strany čo ste sa dozvedeli.
|
||||
- Vypracujte prehľad novej odbornej literatúry na tému Text Categorization. Zistite aké štatistické a neurónové metódy sa používajú. Ako základ Vám poslúži článok vyššie.
|
||||
- Vypracujte prehľad novej odbornej literatúry na tému Text Categorization. Zistite aké štatistické a neurónové metódy sa používajú. Ako základ Vám poslúži článok nižšie.
|
||||
- Prečítajte si článok "Comparison of Statistical Algorithms and Deep Learning for Slovak Document Classification" https://ieeexplore.ieee.org/abstract/document/9869155 dostupný z TUKE siete. Napíšte na pol strany čo ste sa dozvedeli.
|
||||
|
||||
- Zopakujte experiment s klasifikáciou slovenských novinových článkov. Použite knižnicu HF transformers, Skripty Vám dodá vedúci. Použite knižnicu HF transformers, Skripty Vám dodá vedúci. Použite "Slovak Categorized News Corpus" na trénovanie.
|
||||
|
||||
|
||||
Zásobník úloh:
|
||||
|
||||
- Pripravte skript, ktorý bude vedieť klasifikovať neznáme články uložené v databáze.
|
||||
|
||||
# Vedecký projekt 2022
|
||||
|
Loading…
Reference in New Issue
Block a user