zpwiki/pages/students/2022/jan_malinovsky
2026-05-14 11:51:04 +00:00
..
README.md Update pages/students/2022/jan_malinovsky/README.md 2026-05-14 11:51:04 +00:00

title published taxonomy
Ján Malinovský true
category tag author
dp2027
rag
nlp
Daniel Hladek

rok začiatku štúdia: 2022

Diplomový projekt 2026

Téma:

Grafové vyhľadávanie pre podporu vzdelávania

Ciele na semester.

  • Zistite čo je to Retrieval Augmented Generation
  • Zistite, čo je to znalostný graf
  • Naučte sa čo je to GraphRAG
  • Zostavte malý znalostný graf z oblasti vzdelávania. Pri zostavení môžete využiť jazykový model. Môžete preložiť existujúci znalostný graf.
  • Využite znalostný graf pre zlepšenie práce alebo vysvetliteľnosti jazkového modelu

Napr.

  • výchovné opatrenia v špeciálnej pedagogike.
  • osnovy pre výuku na základnej škole.
  • spôsoby práce asistenta pedagóga.

Stretnutie 14.5.2026

Stav:

  • Preštudované materiály podľa pokynov nižšie .
  • Získané dokumenty - osnovy pre pre základné školy: slovenčina, matematika, angličtina, informatika, fyzika, biológia, občianska náuka, telesná výchova, chémia pre všetky ročníky.
  • Extrahovaný text pomocou pypdf a docx. Sú tam aj excel tabuľky, ale tie nie sú extrahované.
  • Text sa rozdelí na chunky (cca 8000 znakov), vypočíta sa hash na deduplikáciu.
  • Pomocou LM sa dokument transformtuje na JSON. Z dokumentu LLM extrahuje "vzdelávacie koncepty" a vzťahy medzi nimi. Vzťahy sú z určenej množiny typu "implements", "depends on", "teaches", "requires".
  • Výsledok sa zobrazí vo forme grafu.
  • Vytvorený jednoduchý agent, ktorý vyhľadáva v znalostnom grafe a na základe týchto informácií generuje odpoveď.

Zdroje doumentov:

Úlohy:

  • dajte zdrojové kódy na GIT.

Týka sa ďalšieho obdobia:

  • Pozrite si https://github.com/hkuds/minirag . Prečítajte si článok, vyskúšajte zdrojové kódy s dátami ktoré máte.
  • Pozrite si https://github.com/HKUDS/LightRAG. Prečítajte si článok, pozrite zdrojové kódy, môžete aj vyskúšať.
  • Preštudujte si jazyk Cypher.
  • Preštudujte si embedding modely a vektorové databázy, napr. ChromaDB a multilingual e5-large.
  • Pokračujte štúdiu GraphRAG:
  • Vytovrte webové demo pre pomoco pedagógovi pri príprave na hodinu. Môžete použiť gradio alebo streamlit.
  • Vytvorte agenta pre pomoc učiteľovi alebo pedagogickému asistentovi pri príprave na vyučovanie.

Zásobník úloh:

  • Využite školskú infraštruktúru
  • Zlepšite proces tvorby znalostného grafu. Zlepšite druhy vzájomných vzťahov, zlepšite proces extrakcie.
  • Vytvorte proces zhlukovania konceptov (pomenovaných entít)
  • Použite grafovú datagázu Neo4J alebo inú.
  • Jeden z možných spôsobov vyhľadávnaia je použitie relačnej dabázy.
  • Preštudujte si spôsoby vyhodnotenia RAG - RAGAS, DeepEval a vyhodnnotte systém.

Stretnutie 20.2.2026

Úlohy:

Zásobník úloh: