Update 'pages/students/2016/tomas_kucharik/README.md'

This commit is contained in:
dano 2021-10-15 07:46:05 +00:00
parent b4801adcbf
commit 83a473375a

View File

@ -2,13 +2,45 @@
title: Tomáš Kuchárik title: Tomáš Kuchárik
published: true published: true
taxonomy: taxonomy:
category: [dp2021] category: [dp2021,dp2022]
tag: [annotation,question-answer,nlp] tag: [annotation,question-answer,nlp]
author: Daniel Hladek author: Daniel Hladek
--- ---
# Tomáš Kuchárik # Tomáš Kuchárik
(študent KPI) (študent KPI)
## Diplomová práca 2022
Názov: Tvorba korpusu otázok a odpovedí v slovenskom jazyku pomocou strojového prekladu
Zadanie:
1. Vypracujte prehľad jazykových mutácii overovacej množiny SQUAD a opíšte spôsob ich tvorby.
2. Vypracujte prehľad aktuálnych systémov pre generovanie odpovede na otázku v prirodzenom jazyku.
3. Navrhnite postup pre vytvorenie korpusu otázok a odpovedí v slovenskom jazyku pomocou strojového prekladu z anglického jazyka,
4. Porovnajte strojovo preloženú verziu SQUAD s manuálne vytvorenou verziou.
5. Porovnajte presnosť systému generovania odpovedí naučenom na strojovo preloženej verzie SQUAD s s manuálne vytvorenou verziou.
## Diplomový projekt 2 2021
Cieľom je vytvoriť strojovo preloženú verziu SQUAD a overiť ju na QA systém.
Stretnutie 15.10.
Stav:
- Pôvodné zadanie neaktuálne
Úlohy:
- Upraviť nové zadanie DP.
- Urobiť písomný prieskum rôznych jazykových verzií overovacej množiny squad a spôsobov ich vytvorenia. Môžete začať v archíve HuggingFace Datasets.
- Vybrať vhodný spôsob ako strojovo preložiť SQUAD. Zistiť aké sú možné problémy.
- Zistiť ako funguje strojový preklad cez API.
Zásobník úloh:
- Urobiť vyhodnotenie SQUAD na knižnici Hugging Face Transformers.
## Diplomová práca 2021 ## Diplomová práca 2021
Názov: Tvorba korpusu otázok a odpovedí v slovenskom jazyku pomocou crowdsourcingu Názov: Tvorba korpusu otázok a odpovedí v slovenskom jazyku pomocou crowdsourcingu