diff --git a/pages/students/2016/tomas_kucharik/README.md b/pages/students/2016/tomas_kucharik/README.md index 123a1160..3c7835a6 100644 --- a/pages/students/2016/tomas_kucharik/README.md +++ b/pages/students/2016/tomas_kucharik/README.md @@ -22,7 +22,7 @@ Názov: Tvorba korpusu otázok a odpovedí v slovenskom jazyku pomocou strojové Zadanie: -1. Vypracujte prehľad jazykových mutácii overovacej množiny SQUAD a opíšte spôsob ich tvorby. +1. Vypracujte prehľad jazykových mutácii overovacej množiny SQUAD a opíšte spôsob ich tvorby. 2. Vypracujte prehľad aktuálnych systémov pre generovanie odpovede na otázku v prirodzenom jazyku. 3. Navrhnite postup pre vytvorenie korpusu otázok a odpovedí v slovenskom jazyku pomocou strojového prekladu z anglického jazyka, 4. Porovnajte strojovo preloženú verziu SQUAD s manuálne vytvorenou verziou. @@ -40,11 +40,19 @@ Stav: - Začatý priestup prekladových API - napr. na google sa platí 20 $ za milion znakov. - Zaujala ma metód prekladu pomocou špeciálnych znakov. - Španielsky SQUAD má svoju štatistickú metódu zarovnania. +- Možnosti pre preklad: + - Google, Microsoft v rámci Free kreditu (asi ho je málo). + - Zakúpiť kredit cez projekt. + - Využiť "nekomerčný" projekt pre preklad, napr. [etranslation](https://ec.europa.eu/cefdigital/wiki/display/CEFDIGITAL/eTranslation). + + + Úlohy: - Pokračujte v písomnom prieskume jazykových mutácií SQUAD. -- Začnite pracovať na skripte na strojový preklad SQUAD. Jedna z možností je prepísať SQUAD do čisto textového formátu obohateného o špeciálne značky. +- Začnite pracovať na skripte na strojový preklad SQUAD. Jedna z možností je prepísať SQUAD do čisto textového formátu obohateného o špeciálne značky. Pripravte skript, ktorý prevedie SQUAD do čisto textového formátu obohateného o špeciálne značky. Vyskúšajte formát v dostupných prekladačoch. V prípade, že značky sú zachované, pripravte aj skript na spätnú konverziu preloženého výsledku do formátu SQUAD. +