From fffb2002963a6acb1c079336621a46bf8e57e094 Mon Sep 17 00:00:00 2001 From: Daniel Hladek Date: Fri, 20 Feb 2026 14:25:47 +0100 Subject: [PATCH] zz --- .../students/2022/valerii_kutsenko/README.md | 32 ++++++++++++++++++- 1 file changed, 31 insertions(+), 1 deletion(-) diff --git a/pages/students/2022/valerii_kutsenko/README.md b/pages/students/2022/valerii_kutsenko/README.md index dcdd7581..e3c9c9c9 100644 --- a/pages/students/2022/valerii_kutsenko/README.md +++ b/pages/students/2022/valerii_kutsenko/README.md @@ -2,7 +2,7 @@ title: Valerii Kutsenko published: true taxonomy: - category: [vp2024,bp2025] + category: [vp2024,bp2025,dp2027] tag: [rag,nlp] author: Daniel Hladek --- @@ -11,6 +11,36 @@ rok začiatku štúdia: 2022 # Diplomová práca 2027 +Augmentácia dát pre zlepšenie získavania infdormácií + + +Ciele na prácu: + +- Zlepšiť slovenský vektorový jazykový model pomocou umelo generovaných dát. +- Preskúmať možnosti augmentácie pre lepšie využitie znalostných grafov +- Preskúmať možnosti agmentácie pre vyhľadávanie v (slabo) štruktúrovaných dátach. +- Chceme napríklad vedieť vyhľadávať priamo v JSON. + +Ciele na semester: + +- Dotrénovať slovenský vektorový model pre vyhľadávanie s promptom. +- Preskúmať možnosti zlepšenia vyhľadávania pomocou promptingu. + + +Úlohy: + +- Vyberte vhodný model pre pre základ. me5 majú pomerne malý kontext. +- Natrénujte a vyhodnotte slovenský vektorový model pomocou dodaného skriptu. +- Zistite, ako sa trénujú vektorové modely s podporou promptu a napíšte o tom krátku správu. Aké metódy existujú? + +Zásobník úloh: + +- Natrénujte vektorový model s podporou promptu. +- Pozrite si https://graphrag.com/ +- Pozrite si https://github.com/topoteretes/cognee + + + Nápady na tému: - Augmentácia dát - generovanie umelých trénovacích množín.