From 06d2651d3aaf6cd2c8c3001437a57567c4e2e833 Mon Sep 17 00:00:00 2001 From: dano Date: Thu, 20 Feb 2025 14:42:08 +0000 Subject: [PATCH] Update pages/students/2021/nikita_bodnar/README.md --- pages/students/2021/nikita_bodnar/README.md | 27 +++++++++++++++------ 1 file changed, 20 insertions(+), 7 deletions(-) diff --git a/pages/students/2021/nikita_bodnar/README.md b/pages/students/2021/nikita_bodnar/README.md index 64902698..617a2e62 100644 --- a/pages/students/2021/nikita_bodnar/README.md +++ b/pages/students/2021/nikita_bodnar/README.md @@ -21,23 +21,36 @@ Zadanie: Stav: - Vybratá množina c4 -- +- Vyhodnotenie SlovakBERT, mBERT a Roberta Base pre EN. +- Naprogramované úloha doplnenie interpunkcie. Kódy sú na GITE. + +Úlohy: + +- Vyberte slovenské texty z množiny mC4. Na vybranom texte zopakujte experimenty. +- Doplnte ďalšie modely typu BERT s podporou slovenčiny. +- Vypracujte tabuľky s výsledkami experimentov. +- Do práce opíšte experimenty. + +Zásobník úloh: + +- Vypracujte experimenty pre modely Byt5 a slovak t5. Poznámky 21.1.2025 Stav: -- Napísané skripty pre vyhodnotneie "masked" language modeling. +- Napísané skripty pre vyhodnotenie "masked" language modeling. - Vyhodnotené modely SlovakBERT a multilingualbert BASE. + Úlohy: -- Vyberte vhodnú množinu slovenských textov. -- Pripravte množinu pre úlohu detekcie chýbajúcej alebo nadbytočnej interpunkcie - (bodka, čiarka, otáznik, výkričník, dvojbodka). -- Pripravte množinu pre pre úlohu opravy od identifikovaného preklepu. -- Vyhodnotte viaceré modely. -- Pokračujte v písaní práce podľa nového zadania. +- [x] Vyberte vhodnú množinu slovenských textov. +- [-] Pripravte množinu pre úlohu detekcie chýbajúcej alebo nadbytočnej interpunkcie - (bodka, čiarka, otáznik, výkričník, dvojbodka). +- [-] Pripravte množinu pre pre úlohu opravy od identifikovaného preklepu. +- [-] Vyhodnotte viaceré modely. +- [ ] Pokračujte v písaní práce podľa nového zadania. Zásobník úloh: