This commit is contained in:
Daniel Hládek 2026-02-20 14:25:47 +01:00
parent f5c2599987
commit fffb200296

View File

@ -2,7 +2,7 @@
title: Valerii Kutsenko
published: true
taxonomy:
category: [vp2024,bp2025]
category: [vp2024,bp2025,dp2027]
tag: [rag,nlp]
author: Daniel Hladek
---
@ -11,6 +11,36 @@ rok začiatku štúdia: 2022
# Diplomová práca 2027
Augmentácia dát pre zlepšenie získavania infdormácií
Ciele na prácu:
- Zlepšiť slovenský vektorový jazykový model pomocou umelo generovaných dát.
- Preskúmať možnosti augmentácie pre lepšie využitie znalostných grafov
- Preskúmať možnosti agmentácie pre vyhľadávanie v (slabo) štruktúrovaných dátach.
- Chceme napríklad vedieť vyhľadávať priamo v JSON.
Ciele na semester:
- Dotrénovať slovenský vektorový model pre vyhľadávanie s promptom.
- Preskúmať možnosti zlepšenia vyhľadávania pomocou promptingu.
Úlohy:
- Vyberte vhodný model pre pre základ. me5 majú pomerne malý kontext.
- Natrénujte a vyhodnotte slovenský vektorový model pomocou dodaného skriptu.
- Zistite, ako sa trénujú vektorové modely s podporou promptu a napíšte o tom krátku správu. Aké metódy existujú?
Zásobník úloh:
- Natrénujte vektorový model s podporou promptu.
- Pozrite si https://graphrag.com/
- Pozrite si https://github.com/topoteretes/cognee
Nápady na tému:
- Augmentácia dát - generovanie umelých trénovacích množín.