From 9a62bcd94daac38233799de0706b350f2632994f Mon Sep 17 00:00:00 2001 From: dano Date: Fri, 22 Nov 2024 09:27:11 +0000 Subject: [PATCH] Update pages/students/2022/valerii_kutsenko/README.md --- .../students/2022/valerii_kutsenko/README.md | 19 +++++++++++++++++-- 1 file changed, 17 insertions(+), 2 deletions(-) diff --git a/pages/students/2022/valerii_kutsenko/README.md b/pages/students/2022/valerii_kutsenko/README.md index 73c238a8f..e2d0e6a62 100644 --- a/pages/students/2022/valerii_kutsenko/README.md +++ b/pages/students/2022/valerii_kutsenko/README.md @@ -14,7 +14,7 @@ rok začiatku štúdia: 2022 Generovanie otázok zo zadaného textu. -Cieľ je vylepšiť slovenský model pre generovanie vektrovej reprezentácie. vylepšiť proces RAG: Generovanie jazyka s pomocou vyhľadávania -Retrieval augmented generation +Cieľ je vylepšiť slovenský model pre generovanie vektrovej reprezentácie. vylepšiť proces RAG: Generovanie jazyka s pomocou vyhľadávania - Retrieval augmented generation Nové nápady: @@ -25,7 +25,7 @@ Nové nápady: Ako na to: - Natrénujte generatívny model pre generovanie otázok. Použite existujúci skript a množinu SKQUAD. -- Určite, ktorá otázka je dobre vygenerovaná a ktorá nie. Tu môžete použiť: systém pre vyhľadávanie alebo neurónovú sieť pre otázky a odpovede. Ku otázke viete nájsť odpovede pomocou neurónovej siete. Výstupom by mala byť čo najkvalitnejšia množina otázok a dpovedí ku odsekom. +- Určite, ktorá otázka je dobre vygenerovaná a ktorá nie. Tu môžete použiť: systém pre vyhľadávanie alebo neurónovú sieť pre otázky a odpovede. Ku otázke viete nájsť odpovede pomocou neurónovej siete. Výstupom by mala byť čo najkvalitnejšia množina otázok a odpovedí ku odsekom. - Výstupom by mala byť umelo generovaná databáza otázok a odpovedí. Stretnutie 22.11.2024 @@ -37,6 +37,21 @@ Stav: - Napísaná tabuľka s výsledkami experimentov. Metriky BLEU a ROGUE. - Napísaný skript, skript je na gite. +Úlohy: + +- Pokračujte v písaní práce. +- Pridajte slovak t5 base model do experimentov. +- Dotrénujte Slovak Falcon. Tam bude treba iný skript. + +Zásobník úloh: + +- Vymyslieť systém - natrénovať meurónku na návrh "odpovede". +- Vyskúšať generovať otázky bez zadanej odpovede. Odpoveď generujte pomocou modelu. Model pre automatické odpovede už je na HF Hube: slovakbert-skquad. +- Vyradiť také otázky, na ktoré systém nevie dopovedať. +- Skúsiť generovať otázky z medicínskeho textu. + + + Stretnutie 18.10.2024 Stav: