Update pages/students/2021/nikita_bodnar/README.md
This commit is contained in:
parent
6fbde6e66b
commit
06d2651d3a
@ -21,23 +21,36 @@ Zadanie:
|
||||
Stav:
|
||||
|
||||
- Vybratá množina c4
|
||||
-
|
||||
- Vyhodnotenie SlovakBERT, mBERT a Roberta Base pre EN.
|
||||
- Naprogramované úloha doplnenie interpunkcie. Kódy sú na GITE.
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Vyberte slovenské texty z množiny mC4. Na vybranom texte zopakujte experimenty.
|
||||
- Doplnte ďalšie modely typu BERT s podporou slovenčiny.
|
||||
- Vypracujte tabuľky s výsledkami experimentov.
|
||||
- Do práce opíšte experimenty.
|
||||
|
||||
Zásobník úloh:
|
||||
|
||||
- Vypracujte experimenty pre modely Byt5 a slovak t5.
|
||||
|
||||
|
||||
Poznámky 21.1.2025
|
||||
|
||||
Stav:
|
||||
|
||||
- Napísané skripty pre vyhodnotneie "masked" language modeling.
|
||||
- Napísané skripty pre vyhodnotenie "masked" language modeling.
|
||||
- Vyhodnotené modely SlovakBERT a multilingualbert BASE.
|
||||
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Vyberte vhodnú množinu slovenských textov.
|
||||
- Pripravte množinu pre úlohu detekcie chýbajúcej alebo nadbytočnej interpunkcie - (bodka, čiarka, otáznik, výkričník, dvojbodka).
|
||||
- Pripravte množinu pre pre úlohu opravy od identifikovaného preklepu.
|
||||
- Vyhodnotte viaceré modely.
|
||||
- Pokračujte v písaní práce podľa nového zadania.
|
||||
- [x] Vyberte vhodnú množinu slovenských textov.
|
||||
- [-] Pripravte množinu pre úlohu detekcie chýbajúcej alebo nadbytočnej interpunkcie - (bodka, čiarka, otáznik, výkričník, dvojbodka).
|
||||
- [-] Pripravte množinu pre pre úlohu opravy od identifikovaného preklepu.
|
||||
- [-] Vyhodnotte viaceré modely.
|
||||
- [ ] Pokračujte v písaní práce podľa nového zadania.
|
||||
|
||||
Zásobník úloh:
|
||||
|
||||
|
Loading…
Reference in New Issue
Block a user