diff --git a/pages/students/2022/valerii_kutsenko/README.md b/pages/students/2022/valerii_kutsenko/README.md index 26d6a0f5..b53e69cc 100644 --- a/pages/students/2022/valerii_kutsenko/README.md +++ b/pages/students/2022/valerii_kutsenko/README.md @@ -41,8 +41,17 @@ Stav: - Vytvorený skkript pre prípravu nového generovaného korpusu. Obsahuje kontext, otázku aj odpoveď. Zatiaľ nevie vyznačiť odpoveĎ v kontexte. - Vygenerované korpusy otázok a odpovedí pre SKWIKI a prokuratúru. -- Natrénovaný model pre QA na základe SKWIKI generovaných dát - model slovak T5 base. +- Natrénovaný model pre QA na základe SKWIKI generovaných dát - model slovak T5 base. Augmntovaná množina má zatiaľ 30k otázok. +- Vyzerá to tak, že model s augmentovanými dátami je o dosť lepší. Je to naozaj dobre? +Úlohy: + +- Overiť či generované množina nie je príliš podobná overovacej. +- Pokračujte v písaní práce , opíšte experimenty, vypracujte tabuľky. + +Zásobník úloh: + +- Publikovať na konferencii. Stretnutie 25.2.