Update pages/students/2022/valerii_kutsenko/README.md

This commit is contained in:
dano 2025-03-07 10:59:44 +00:00
parent c42ea60e85
commit bd92534fdd

View File

@ -41,8 +41,17 @@ Stav:
- Vytvorený skkript pre prípravu nového generovaného korpusu. Obsahuje kontext, otázku aj odpoveď. Zatiaľ nevie vyznačiť odpoveĎ v kontexte. - Vytvorený skkript pre prípravu nového generovaného korpusu. Obsahuje kontext, otázku aj odpoveď. Zatiaľ nevie vyznačiť odpoveĎ v kontexte.
- Vygenerované korpusy otázok a odpovedí pre SKWIKI a prokuratúru. - Vygenerované korpusy otázok a odpovedí pre SKWIKI a prokuratúru.
- Natrénovaný model pre QA na základe SKWIKI generovaných dát - model slovak T5 base. - Natrénovaný model pre QA na základe SKWIKI generovaných dát - model slovak T5 base. Augmntovaná množina má zatiaľ 30k otázok.
- Vyzerá to tak, že model s augmentovanými dátami je o dosť lepší. Je to naozaj dobre?
Úlohy:
- Overiť či generované množina nie je príliš podobná overovacej.
- Pokračujte v písaní práce , opíšte experimenty, vypracujte tabuľky.
Zásobník úloh:
- Publikovať na konferencii.
Stretnutie 25.2. Stretnutie 25.2.