From 1d93bc6b885f64e5666dffbc99b43db59012ff3f Mon Sep 17 00:00:00 2001 From: dano Date: Tue, 25 Jun 2024 07:55:23 +0000 Subject: [PATCH] Update 'pages/students/2022/valerii_kutsenko/README.md' --- .../students/2022/valerii_kutsenko/README.md | 21 ++++++++++++++++--- 1 file changed, 18 insertions(+), 3 deletions(-) diff --git a/pages/students/2022/valerii_kutsenko/README.md b/pages/students/2022/valerii_kutsenko/README.md index 5f708488..c10fc167 100644 --- a/pages/students/2022/valerii_kutsenko/README.md +++ b/pages/students/2022/valerii_kutsenko/README.md @@ -15,11 +15,26 @@ rok začiatku štúdia: 2022 -Cieľ je vylepšiť slovenský model pre generovanie vektrovej reprezentácie. +Cieľ je vylepšiť slovenský model pre generovanie vektrovej reprezentácie. vylepšiť proces RAG: Generovanie jazyka s pomocou vyhľadávania -Retrieval augmented generation -- vylepšiť proces RAG: Generovanie jazyka s pomocou vyhľadávania -Retrieval augmented generation +Nové nápady: - +- Vytvorte systém pre generovanie otázok o zadanom texte. +- Vytvorte umelo generovanú množinu otázok a odpovedí. +- Pomocou umelej množiny zlepšite existujúci systém pre otázky a odpovede. + +Ako na to: + +- Natrénujte generatívny model pre generovanie otázok. Použite existujúci skript a množinu SKQUAD. +- Určite, ktorá otázka je dobre vygenerovaná a ktorá nie. Tu môžete použiť: systém pre vyhľadávanie alebo neurónovú sieť pre otázky a odpovede. Ku otázke viete nájsť odpovede pomocou neurónovej siete. Výstupom by mala byť čo najkvalitnejšia množina otázok a dpovedí ku odsekom. +- Výstupom by mala byť umelo generovaná datqabáza otázok a odpovedí. + +Úlohy: + + + + +Staré Nápady: - Možno pomocou vytvorenia-prekladu vlastnej trénovacej databázy. - alebo pomocou nekontrolovaného učenia, reps. augmentácie alebo generovania. - Alebo zber trénovacích dát z webového korpusu.