diff --git a/pages/students/2021/nikita_bodnar/README.md b/pages/students/2021/nikita_bodnar/README.md index 10625fa3b..fe6459711 100644 --- a/pages/students/2021/nikita_bodnar/README.md +++ b/pages/students/2021/nikita_bodnar/README.md @@ -11,6 +11,30 @@ taxonomy: rok začiatku štúdia: 2021 # Bakalárska práca 2025 +Stretnutie 17.12. + + +Stav: + +- Práca na skriptoch, nainštalovaný Pytorch, transformers, fairseq, +- Skript na prípravu dát - spustený. +- chyba pri spustení trénovacieho skriptu - chýba executable. + +Úlohy: + +- ! Začnite pracovať na písomnej časti. +- Nainštalujte si Marian NMT. +- Vypýtajte si Marian Model na opravu od Ing. Maroš Harahus. +- Vyskúšajte ho a vyhodnotte pomocou metriky WER. Zistite si čo je to WER, napíšte to do práce +- Nainštalujte si model ByT5 z knižnice HF Transformers. Zistie čo to je, napíšte to do práce. +- Vyskúšajte model ByT5 na korekciu textu. Vyhodnoote ho. +- Vyskúšajte model SlovakBERT na detekciu preklepov. Model určuje pravdepodobnosť každého slova vo vete. Model vie doplniť chýbajúce slovo, alebo najpravdepodobnejšie slovo. Zistite že ako, napíšte to do práce. +- Do práce doplnte odkazy na vedecké články. + + +Zásobník úloh: + +- Natrénujte model. Stav: