diff --git a/pages/students/2021/eduard_matovka/README.md b/pages/students/2021/eduard_matovka/README.md index 553ae84817..5e82479c9e 100644 --- a/pages/students/2021/eduard_matovka/README.md +++ b/pages/students/2021/eduard_matovka/README.md @@ -49,14 +49,17 @@ Stav Úlohy: -- Vyhodnotiť natrénovaný model. +- Vyhodnotiť natrénovaný model. Dáta, ktoré máte k dispozícii rozdeľte na trénovaciu a testovaciu časť. Môžeme rozdeliť Instruct dáta osobitne, diskusné dáta osobitne. Vzniknú nám dve testovacie množiny. Vyhoddnotte model pred trénovaním aj po trénovaní. Možné metriky sú: ROUGE a BLEU. Zistite si čo to je. Výsledky zapíšte do tabuľky. Pre urýchlenie trénovania môžete využiť TITAN. - Pokračovať v písaní práce. +- Skripty dať na GIT. Na trénovanie aj na prípravu dát. Na git nedávajte veľké dáta. + Zásobnk úloh: - Nájsť ďalšie tréningové údaje pre model​ - Vytvoriť rozšírené webové rozhranie, ktoré sa bude pohodlnejšie používať​ - Optimalizovať algoritmy, aby sa zvýšila účinnosť​ +- Skúste na Titane natrénovať nejaký "lepší" model LLAMA ako 7B-4bit. Stretnutie 7.12.2023