diff --git a/pages/students/2021/nikita_bodnar/README.md b/pages/students/2021/nikita_bodnar/README.md index 64902698..617a2e62 100644 --- a/pages/students/2021/nikita_bodnar/README.md +++ b/pages/students/2021/nikita_bodnar/README.md @@ -21,23 +21,36 @@ Zadanie: Stav: - Vybratá množina c4 -- +- Vyhodnotenie SlovakBERT, mBERT a Roberta Base pre EN. +- Naprogramované úloha doplnenie interpunkcie. Kódy sú na GITE. + +Úlohy: + +- Vyberte slovenské texty z množiny mC4. Na vybranom texte zopakujte experimenty. +- Doplnte ďalšie modely typu BERT s podporou slovenčiny. +- Vypracujte tabuľky s výsledkami experimentov. +- Do práce opíšte experimenty. + +Zásobník úloh: + +- Vypracujte experimenty pre modely Byt5 a slovak t5. Poznámky 21.1.2025 Stav: -- Napísané skripty pre vyhodnotneie "masked" language modeling. +- Napísané skripty pre vyhodnotenie "masked" language modeling. - Vyhodnotené modely SlovakBERT a multilingualbert BASE. + Úlohy: -- Vyberte vhodnú množinu slovenských textov. -- Pripravte množinu pre úlohu detekcie chýbajúcej alebo nadbytočnej interpunkcie - (bodka, čiarka, otáznik, výkričník, dvojbodka). -- Pripravte množinu pre pre úlohu opravy od identifikovaného preklepu. -- Vyhodnotte viaceré modely. -- Pokračujte v písaní práce podľa nového zadania. +- [x] Vyberte vhodnú množinu slovenských textov. +- [-] Pripravte množinu pre úlohu detekcie chýbajúcej alebo nadbytočnej interpunkcie - (bodka, čiarka, otáznik, výkričník, dvojbodka). +- [-] Pripravte množinu pre pre úlohu opravy od identifikovaného preklepu. +- [-] Vyhodnotte viaceré modely. +- [ ] Pokračujte v písaní práce podľa nového zadania. Zásobník úloh: