From c9ecb1e117f713bc9b644246f5a77771e42cb97e Mon Sep 17 00:00:00 2001 From: dano Date: Tue, 17 Dec 2024 15:24:01 +0000 Subject: [PATCH] Update pages/students/2021/nikita_bodnar/README.md --- pages/students/2021/nikita_bodnar/README.md | 24 +++++++++++++++++++++ 1 file changed, 24 insertions(+) diff --git a/pages/students/2021/nikita_bodnar/README.md b/pages/students/2021/nikita_bodnar/README.md index 10625fa3b..fe6459711 100644 --- a/pages/students/2021/nikita_bodnar/README.md +++ b/pages/students/2021/nikita_bodnar/README.md @@ -11,6 +11,30 @@ taxonomy: rok začiatku štúdia: 2021 # Bakalárska práca 2025 +Stretnutie 17.12. + + +Stav: + +- Práca na skriptoch, nainštalovaný Pytorch, transformers, fairseq, +- Skript na prípravu dát - spustený. +- chyba pri spustení trénovacieho skriptu - chýba executable. + +Úlohy: + +- ! Začnite pracovať na písomnej časti. +- Nainštalujte si Marian NMT. +- Vypýtajte si Marian Model na opravu od Ing. Maroš Harahus. +- Vyskúšajte ho a vyhodnotte pomocou metriky WER. Zistite si čo je to WER, napíšte to do práce +- Nainštalujte si model ByT5 z knižnice HF Transformers. Zistie čo to je, napíšte to do práce. +- Vyskúšajte model ByT5 na korekciu textu. Vyhodnoote ho. +- Vyskúšajte model SlovakBERT na detekciu preklepov. Model určuje pravdepodobnosť každého slova vo vete. Model vie doplniť chýbajúce slovo, alebo najpravdepodobnejšie slovo. Zistite že ako, napíšte to do práce. +- Do práce doplnte odkazy na vedecké články. + + +Zásobník úloh: + +- Natrénujte model. Stav: