From cf3ca04242fcef76ee43944a539eb08a8a29a600 Mon Sep 17 00:00:00 2001 From: dano Date: Thu, 26 Oct 2023 10:57:36 +0000 Subject: [PATCH] Update 'pages/students/2021/eduard_matovka/README.md' --- pages/students/2021/eduard_matovka/README.md | 22 +++++++++++++++----- 1 file changed, 17 insertions(+), 5 deletions(-) diff --git a/pages/students/2021/eduard_matovka/README.md b/pages/students/2021/eduard_matovka/README.md index 5d583da5d..447f7a87e 100644 --- a/pages/students/2021/eduard_matovka/README.md +++ b/pages/students/2021/eduard_matovka/README.md @@ -28,6 +28,18 @@ Predbežné úlohy: - Natrénujte neurónovú sieť pre odpovedanie v diskusiách. - Vytvorte webové demo. +Stretnutie 26.10.2023 + + +Stav: + +- Podarilo sa spustiť pipeline pre generovanie pomocou Slovak T5 small. + +Úlohy: + +- Pokračovať v otvorených úlohách z minulého stretnutia. + + Stretnutie 12.10.2023 Stav: @@ -37,11 +49,11 @@ Stav: Úlohy: -- Dobrý model na generovanie Slov. jazyka je Slovak T5 Small. -- Pokračujte v teoretickej príprave podľa otvorených úloh - prehľad generatívnych jazykových modelov. -- Vytvorte dataset slovenských konverzácií. Vyberte zdroj dát, pomocou scrapera extrahujte dáta a upravte ich do vhodného formátu JSON. Stiahnite časť alebo celú webovú stránku do viacerých htmls súborov. Neposielajte veľa requestov za minútu. Dobrý nástorj na stianutie je wget. Napíšte skript, ktorý pomocu knižnice BeautifulSoup4 extrahuje diskusie a uloží ich do JSON. -- Druhá možnosť je použiť dáta z Reditu alebo Faceboku, podľa skriptov V. Ferko. -- Generatívny model už natrénoval p. Omasta a p. Megela. Oboznámte sa s ich profilmi. +- [x] Dobrý model na generovanie Slov. jazyka je Slovak T5 Small. +- [ ] Pokračujte v teoretickej príprave podľa otvorených úloh - prehľad generatívnych jazykových modelov. +- [ ] Vytvorte dataset slovenských konverzácií. Vyberte zdroj dát, pomocou scrapera extrahujte dáta a upravte ich do vhodného formátu JSON. Stiahnite časť alebo celú webovú stránku do viacerých htmls súborov. Neposielajte veľa requestov za minútu. Dobrý nástorj na stianutie je wget. Napíšte skript, ktorý pomocu knižnice BeautifulSoup4 extrahuje diskusie a uloží ich do JSON. +- [ ] Druhá možnosť je použiť dáta z Reditu alebo Faceboku, podľa skriptov V. Ferko. +- [-] Generatívny model už natrénoval p. Omasta a p. Megela. Oboznámte sa s ich profilmi. Stretnutie 1.8.2023