From 83a473375a6df77595002e1bd2860ad2666e25a3 Mon Sep 17 00:00:00 2001 From: dano Date: Fri, 15 Oct 2021 07:46:05 +0000 Subject: [PATCH] Update 'pages/students/2016/tomas_kucharik/README.md' --- pages/students/2016/tomas_kucharik/README.md | 34 +++++++++++++++++++- 1 file changed, 33 insertions(+), 1 deletion(-) diff --git a/pages/students/2016/tomas_kucharik/README.md b/pages/students/2016/tomas_kucharik/README.md index 7da2e59c..f2385cdb 100644 --- a/pages/students/2016/tomas_kucharik/README.md +++ b/pages/students/2016/tomas_kucharik/README.md @@ -2,13 +2,45 @@ title: Tomáš Kuchárik published: true taxonomy: - category: [dp2021] + category: [dp2021,dp2022] tag: [annotation,question-answer,nlp] author: Daniel Hladek --- # Tomáš Kuchárik (študent KPI) +## Diplomová práca 2022 + +Názov: Tvorba korpusu otázok a odpovedí v slovenskom jazyku pomocou strojového prekladu + +Zadanie: + +1. Vypracujte prehľad jazykových mutácii overovacej množiny SQUAD a opíšte spôsob ich tvorby. +2. Vypracujte prehľad aktuálnych systémov pre generovanie odpovede na otázku v prirodzenom jazyku. +3. Navrhnite postup pre vytvorenie korpusu otázok a odpovedí v slovenskom jazyku pomocou strojového prekladu z anglického jazyka, +4. Porovnajte strojovo preloženú verziu SQUAD s manuálne vytvorenou verziou. +5. Porovnajte presnosť systému generovania odpovedí naučenom na strojovo preloženej verzie SQUAD s s manuálne vytvorenou verziou. + +## Diplomový projekt 2 2021 + +Cieľom je vytvoriť strojovo preloženú verziu SQUAD a overiť ju na QA systém. + +Stretnutie 15.10. + +Stav: +- Pôvodné zadanie neaktuálne + +Úlohy: + +- Upraviť nové zadanie DP. +- Urobiť písomný prieskum rôznych jazykových verzií overovacej množiny squad a spôsobov ich vytvorenia. Môžete začať v archíve HuggingFace Datasets. +- Vybrať vhodný spôsob ako strojovo preložiť SQUAD. Zistiť aké sú možné problémy. +- Zistiť ako funguje strojový preklad cez API. + +Zásobník úloh: + +- Urobiť vyhodnotenie SQUAD na knižnici Hugging Face Transformers. + ## Diplomová práca 2021 Názov: Tvorba korpusu otázok a odpovedí v slovenskom jazyku pomocou crowdsourcingu