Update pages/students/2022/jan_malinovsky/README.md

This commit is contained in:
dano 2026-05-14 11:51:04 +00:00
parent 1d4fe226c5
commit bd97a84f62

View File

@ -37,6 +37,13 @@ Stav:
- Preštudované materiály podľa pokynov nižšie . - Preštudované materiály podľa pokynov nižšie .
- Získané dokumenty - osnovy pre pre základné školy: slovenčina, matematika, angličtina, informatika, fyzika, biológia, občianska náuka, telesná výchova, chémia pre všetky ročníky. - Získané dokumenty - osnovy pre pre základné školy: slovenčina, matematika, angličtina, informatika, fyzika, biológia, občianska náuka, telesná výchova, chémia pre všetky ročníky.
- Extrahovaný text pomocou pypdf a docx. Sú tam aj excel tabuľky, ale tie nie sú extrahované.
- Text sa rozdelí na chunky (cca 8000 znakov), vypočíta sa hash na deduplikáciu.
- Pomocou LM sa dokument transformtuje na JSON. Z dokumentu LLM extrahuje "vzdelávacie koncepty" a vzťahy medzi nimi. Vzťahy sú z určenej množiny typu "implements", "depends on", "teaches", "requires".
- Výsledok sa zobrazí vo forme grafu.
- Vytvorený jednoduchý agent, ktorý vyhľadáva v znalostnom grafe a na základe týchto informácií generuje odpoveď.
Zdroje doumentov: Zdroje doumentov:
@ -47,24 +54,31 @@ Zdroje doumentov:
- https://www.minedu.sk/pedagogicky-asistent-podporne-opatrenie/ - https://www.minedu.sk/pedagogicky-asistent-podporne-opatrenie/
- https://podporneopatrenia.minedu.sk/katalog-podpornych-opatreni/ - https://podporneopatrenia.minedu.sk/katalog-podpornych-opatreni/
- Extrahovaný text pomocou pypdf a docx. Sú tam aj excel tabuľky, ale tie nie sú extrahované.
- Text sa rozdelí na chunky (cca 8000 znakov), vypočíta sa hash na deduplikáciu.
- Pomocou LM sa dokument transformtuje na JSON. Z dokumentu LLM extrahuje "vzdelávacie koncepty" a vzťahy medzi nimi. Vzťahy sú z určenej množiny typu "implements", "depends on", "teaches", "requires".
- Výsledok sa zobrazí vo forme grafu.
- Vytvorený jednoduchý agent, ktorý vyhľadáva v znalostnom grafe a na základe týchto informácií generuje odpoveď.
Úlohy: Úlohy:
- dajte zdrojové kódy na GIT. - *dajte zdrojové kódy na GIT*.
Týka sa ďalšieho obdobia:
- Pozrite si https://github.com/hkuds/minirag . Prečítajte si článok, vyskúšajte zdrojové kódy s dátami ktoré máte.
- Pozrite si https://github.com/HKUDS/LightRAG. Prečítajte si článok, pozrite zdrojové kódy, môžete aj vyskúšať.
- Preštudujte si jazyk Cypher.
- Preštudujte si embedding modely a vektorové databázy, napr. ChromaDB a multilingual e5-large.
- Pokračujte štúdiu GraphRAG:
- Vytovrte webové demo pre pomoco pedagógovi pri príprave na hodinu. Môžete použiť gradio alebo streamlit.
- Vytvorte agenta pre pomoc učiteľovi alebo pedagogickému asistentovi pri príprave na vyučovanie.
Zásobník úloh: Zásobník úloh:
- Vytvorte agenta pre pomoc učiteľovi alebo pedagogickému asistentovi pri príprave na vyučovanie.
- Využite školskú infraštruktúru - Využite školskú infraštruktúru
- Zlepšite proces tvorby znalostného grafu. Zlepšite druhy vzájomných vzťahov, zlepšite proces extrakcie. - Zlepšite proces tvorby znalostného grafu. Zlepšite druhy vzájomných vzťahov, zlepšite proces extrakcie.
- Vytvorte proces zhlukovania konceptov (pomenovaných entít) - Vytvorte proces zhlukovania konceptov (pomenovaných entít)
- Vytovrte webové demo pre pomoco pedagógovi pri príprave na hodinu. Môžete použiť gradio alebo streamlit. - Použite grafovú datagázu Neo4J alebo inú.
- Jeden z možných spôsobov vyhľadávnaia je použitie relačnej dabázy.
- Preštudujte si spôsoby vyhodnotenia RAG - RAGAS, DeepEval a vyhodnnotte systém.
Stretnutie 20.2.2026 Stretnutie 20.2.2026