diff --git a/pages/students/2016/tomas_kucharik/README.md b/pages/students/2016/tomas_kucharik/README.md index 7da2e59cab..f2385cdbb5 100644 --- a/pages/students/2016/tomas_kucharik/README.md +++ b/pages/students/2016/tomas_kucharik/README.md @@ -2,13 +2,45 @@ title: Tomáš Kuchárik published: true taxonomy: - category: [dp2021] + category: [dp2021,dp2022] tag: [annotation,question-answer,nlp] author: Daniel Hladek --- # Tomáš Kuchárik (študent KPI) +## Diplomová práca 2022 + +Názov: Tvorba korpusu otázok a odpovedí v slovenskom jazyku pomocou strojového prekladu + +Zadanie: + +1. Vypracujte prehľad jazykových mutácii overovacej množiny SQUAD a opíšte spôsob ich tvorby. +2. Vypracujte prehľad aktuálnych systémov pre generovanie odpovede na otázku v prirodzenom jazyku. +3. Navrhnite postup pre vytvorenie korpusu otázok a odpovedí v slovenskom jazyku pomocou strojového prekladu z anglického jazyka, +4. Porovnajte strojovo preloženú verziu SQUAD s manuálne vytvorenou verziou. +5. Porovnajte presnosť systému generovania odpovedí naučenom na strojovo preloženej verzie SQUAD s s manuálne vytvorenou verziou. + +## Diplomový projekt 2 2021 + +Cieľom je vytvoriť strojovo preloženú verziu SQUAD a overiť ju na QA systém. + +Stretnutie 15.10. + +Stav: +- Pôvodné zadanie neaktuálne + +Úlohy: + +- Upraviť nové zadanie DP. +- Urobiť písomný prieskum rôznych jazykových verzií overovacej množiny squad a spôsobov ich vytvorenia. Môžete začať v archíve HuggingFace Datasets. +- Vybrať vhodný spôsob ako strojovo preložiť SQUAD. Zistiť aké sú možné problémy. +- Zistiť ako funguje strojový preklad cez API. + +Zásobník úloh: + +- Urobiť vyhodnotenie SQUAD na knižnici Hugging Face Transformers. + ## Diplomová práca 2021 Názov: Tvorba korpusu otázok a odpovedí v slovenskom jazyku pomocou crowdsourcingu