From b27f66b38b2ef3abb38787f52a568316ae686db6 Mon Sep 17 00:00:00 2001 From: dano Date: Fri, 27 Sep 2024 08:05:27 +0000 Subject: [PATCH] Update pages/students/2022/valerii_kutsenko/README.md --- .../students/2022/valerii_kutsenko/README.md | 25 +++++++++++++++++-- 1 file changed, 23 insertions(+), 2 deletions(-) diff --git a/pages/students/2022/valerii_kutsenko/README.md b/pages/students/2022/valerii_kutsenko/README.md index 060790b84..5b9d97afe 100644 --- a/pages/students/2022/valerii_kutsenko/README.md +++ b/pages/students/2022/valerii_kutsenko/README.md @@ -20,8 +20,8 @@ Cieľ je vylepšiť slovenský model pre generovanie vektrovej reprezentácie. v Nové nápady: - Vytvorte systém pre generovanie otázok o zadanom texte. -- Vytvorte umelo generovanú množinu otázok a odpovedí. -- Pomocou umelej množiny zlepšite existujúci systém pre otázky a odpovede. +- Vytvorte umelo generovanú množinu otázok a odpovedí o liekoch. +- Pomocou umelej množiny zlepšite existujúci systém pre otázky a odpovede o liekoch. Ako na to: @@ -29,8 +29,29 @@ Ako na to: - Určite, ktorá otázka je dobre vygenerovaná a ktorá nie. Tu môžete použiť: systém pre vyhľadávanie alebo neurónovú sieť pre otázky a odpovede. Ku otázke viete nájsť odpovede pomocou neurónovej siete. Výstupom by mala byť čo najkvalitnejšia množina otázok a dpovedí ku odsekom. - Výstupom by mala byť umelo generovaná databáza otázok a odpovedí. +Stretnutie 27.9.2024 + +Stav: + +- Prezereté repozitáre a články. Napísané poznámky. +- Vytvorený prázdny git repozitár. + Úlohy: +- Zistite ako sa dotrénujú generatívne modely HuggingFace. Zistite čo je to Few Shot learning a *urobte si poznámky*. +- Prečítajte si článok o modele Falcon a napíšte ako funguje. Prečítajte si článok o modele T5 a napíšte ako funguje. +- Dotrénujte generatívny model na generovanie otázok podľa zadaného paragrafu. Na dotrénovanie použite databázu SK QUAD. Ako model použite Slovak T5 Base alebo Slovak Falcon 7 B. +- Oboznámte sa s Hugggingface API a OpenAI API. Na generovanie môžete použiť aj toto api. +- Skripty na dotrénovanie dávajte do GIT repozitára. + +Zásobník úloh: + +- Zoberte databázu liekov a generujte otázky o liekoch - od Ing. K. Sopkovič, alebo O. Poiasnik. +- Možno bude treba použiť ChatGPT API a príklady z databázy SK QUAD. +- Možno bude treba dotrénovať Slovak Falcon 7B na inštrukcie. + +Staré Úlohy: + - Zistite, aké sú možné prístupy ku generovaniu otázok pomocou generatívneho modelu a aké sú možné prístupy k overeniu vygenerovanej otázky. - Pozrite si repozitár https://github.com/patil-suraj/question_generation - Pozrite si repozitár https://github.com/gauthierdmn/question_generation