diff --git a/pages/students/2022/valerii_kutsenko/README.md b/pages/students/2022/valerii_kutsenko/README.md index 5f708488f..c10fc1674 100644 --- a/pages/students/2022/valerii_kutsenko/README.md +++ b/pages/students/2022/valerii_kutsenko/README.md @@ -15,11 +15,26 @@ rok začiatku štúdia: 2022 -Cieľ je vylepšiť slovenský model pre generovanie vektrovej reprezentácie. +Cieľ je vylepšiť slovenský model pre generovanie vektrovej reprezentácie. vylepšiť proces RAG: Generovanie jazyka s pomocou vyhľadávania -Retrieval augmented generation -- vylepšiť proces RAG: Generovanie jazyka s pomocou vyhľadávania -Retrieval augmented generation +Nové nápady: - +- Vytvorte systém pre generovanie otázok o zadanom texte. +- Vytvorte umelo generovanú množinu otázok a odpovedí. +- Pomocou umelej množiny zlepšite existujúci systém pre otázky a odpovede. + +Ako na to: + +- Natrénujte generatívny model pre generovanie otázok. Použite existujúci skript a množinu SKQUAD. +- Určite, ktorá otázka je dobre vygenerovaná a ktorá nie. Tu môžete použiť: systém pre vyhľadávanie alebo neurónovú sieť pre otázky a odpovede. Ku otázke viete nájsť odpovede pomocou neurónovej siete. Výstupom by mala byť čo najkvalitnejšia množina otázok a dpovedí ku odsekom. +- Výstupom by mala byť umelo generovaná datqabáza otázok a odpovedí. + +Úlohy: + + + + +Staré Nápady: - Možno pomocou vytvorenia-prekladu vlastnej trénovacej databázy. - alebo pomocou nekontrolovaného učenia, reps. augmentácie alebo generovania. - Alebo zber trénovacích dát z webového korpusu.