From 6b72a975e872b3b75a1b3372febe017a6c50d755 Mon Sep 17 00:00:00 2001 From: dano Date: Wed, 14 Aug 2024 13:11:29 +0000 Subject: [PATCH] Update pages/students/2022/andrii_pervashov/README.md --- pages/students/2022/andrii_pervashov/README.md | 17 +++++++++++++++++ 1 file changed, 17 insertions(+) diff --git a/pages/students/2022/andrii_pervashov/README.md b/pages/students/2022/andrii_pervashov/README.md index c02ced05d4..00b1b63d3c 100644 --- a/pages/students/2022/andrii_pervashov/README.md +++ b/pages/students/2022/andrii_pervashov/README.md @@ -34,3 +34,20 @@ Stretnutie 26.4. 2024 - Zistite ako funguje tento model https://huggingface.co/docs/transformers/en/model_doc/byt5 - Napíšte si poznámky o tom ako funguje model Transformers a ako funguje model T5. +Stav: + +- Nainštalovaná Anaconda, rozbehaný anlgický trénovací skript s databázou WikiEdits a modelom T5small. Notebook je príliš pomalý na trénovanie. +- Oboznámenie sa s materiálmi - d2dl aj Python. + +Úlohy: + +- Pokračujte v štúdiu modelov T5 aj GPT aj ChatGPT. Robte si písomné poznámky. Poznačte si odkazy na odborné články, napr. Arxiv. +- Použite server google scholar a zistite ako sa robí ooprava textu pomocu modelu T5. Poznačte si články ktoré sa týkajú tejto témy a napíšte o čom tie články sú. +- Prečítajte si môj článok Survey of Automatic Spelling Correction a urobte si poznámky, +- dotrénujte anglický model t5 small na opravu a vyhodnotte ho. Na vyhodnotneie sa používa metrika WER, CER, SER, BLEU. Zistite čo to je. + +Zásobník úloh: + +- Natrénujte model pre opravu textu v slovenskom jazyku. +- Pripravte webové demo. +