From de2e164040e9b9859b6b72b7558793dcd65839d1 Mon Sep 17 00:00:00 2001 From: dano Date: Fri, 15 Dec 2023 12:13:39 +0000 Subject: [PATCH] Update 'pages/students/2020/vladyslav_krupko/README.md' --- pages/students/2020/vladyslav_krupko/README.md | 3 ++- 1 file changed, 2 insertions(+), 1 deletion(-) diff --git a/pages/students/2020/vladyslav_krupko/README.md b/pages/students/2020/vladyslav_krupko/README.md index a9f687e8..8a007012 100644 --- a/pages/students/2020/vladyslav_krupko/README.md +++ b/pages/students/2020/vladyslav_krupko/README.md @@ -25,8 +25,10 @@ Stav: Úlohy: +- Z webu získajte vhodnú sadu otázok a odpovedí. Uložte ju vo formáte json - jeden dokument na jede riadok. Využite Váš scraper. Ako zdroj skúste použiť Otázky zákazníkov z GymBeam. Uložte - v jednom dokumente by mal byť informácie o produktem otázky aj odpovede. Ak sa to nepodarí, zamerajte sa na iný zdroj dát. Napríklad https://www.modrastrecha.sk/forum/ , alebo https://www.modrykonik.sk/forum. - Pripravte dáta do vhodnej podoby a natrénujte generatívny model - ChatGPT, T5-SMALL, - Vyhoddnotte všetky modely, výsledky sumarizujte v tabuľkách. Experimenty opíšte do práce. +- Urobte si repozitár bp2024 na git.kemt.fei.tuke.sk. Skripty dávajte na git. @@ -45,7 +47,6 @@ Stav: Zásobník úloh: -- Urobte si repozitár bp2024 na git.kemt.fei.tuke.sk. Skripty dávajte na git. - Na generovanie odpovedí použijeme jednoduchý model T5-small v HF transformers. - Vytvorte trénovaciu databázu ktorá Vás zaujíma vo formáte ktorý je požadovaný. Druhá možnosť je využiť "Košické dáta". - Preštudujte si knihu https://d2l.ai/ a napíšte si z nej poznámky.