From bd97a84f620311077937b9aa976d4cb82558a469 Mon Sep 17 00:00:00 2001 From: dano Date: Thu, 14 May 2026 11:51:04 +0000 Subject: [PATCH] Update pages/students/2022/jan_malinovsky/README.md --- pages/students/2022/jan_malinovsky/README.md | 30 ++++++++++++++------ 1 file changed, 22 insertions(+), 8 deletions(-) diff --git a/pages/students/2022/jan_malinovsky/README.md b/pages/students/2022/jan_malinovsky/README.md index 5bae9d334..37d79851d 100644 --- a/pages/students/2022/jan_malinovsky/README.md +++ b/pages/students/2022/jan_malinovsky/README.md @@ -37,6 +37,13 @@ Stav: - Preštudované materiály podľa pokynov nižšie . - Získané dokumenty - osnovy pre pre základné školy: slovenčina, matematika, angličtina, informatika, fyzika, biológia, občianska náuka, telesná výchova, chémia pre všetky ročníky. +- Extrahovaný text pomocou pypdf a docx. Sú tam aj excel tabuľky, ale tie nie sú extrahované. +- Text sa rozdelí na chunky (cca 8000 znakov), vypočíta sa hash na deduplikáciu. +- Pomocou LM sa dokument transformtuje na JSON. Z dokumentu LLM extrahuje "vzdelávacie koncepty" a vzťahy medzi nimi. Vzťahy sú z určenej množiny typu "implements", "depends on", "teaches", "requires". +- Výsledok sa zobrazí vo forme grafu. +- Vytvorený jednoduchý agent, ktorý vyhľadáva v znalostnom grafe a na základe týchto informácií generuje odpoveď. + + Zdroje doumentov: @@ -47,24 +54,31 @@ Zdroje doumentov: - https://www.minedu.sk/pedagogicky-asistent-podporne-opatrenie/ - https://podporneopatrenia.minedu.sk/katalog-podpornych-opatreni/ -- Extrahovaný text pomocou pypdf a docx. Sú tam aj excel tabuľky, ale tie nie sú extrahované. -- Text sa rozdelí na chunky (cca 8000 znakov), vypočíta sa hash na deduplikáciu. -- Pomocou LM sa dokument transformtuje na JSON. Z dokumentu LLM extrahuje "vzdelávacie koncepty" a vzťahy medzi nimi. Vzťahy sú z určenej množiny typu "implements", "depends on", "teaches", "requires". -- Výsledok sa zobrazí vo forme grafu. -- Vytvorený jednoduchý agent, ktorý vyhľadáva v znalostnom grafe a na základe týchto informácií generuje odpoveď. Úlohy: -- dajte zdrojové kódy na GIT. +- *dajte zdrojové kódy na GIT*. + +Týka sa ďalšieho obdobia: + +- Pozrite si https://github.com/hkuds/minirag . Prečítajte si článok, vyskúšajte zdrojové kódy s dátami ktoré máte. +- Pozrite si https://github.com/HKUDS/LightRAG. Prečítajte si článok, pozrite zdrojové kódy, môžete aj vyskúšať. +- Preštudujte si jazyk Cypher. +- Preštudujte si embedding modely a vektorové databázy, napr. ChromaDB a multilingual e5-large. +- Pokračujte štúdiu GraphRAG: +- Vytovrte webové demo pre pomoco pedagógovi pri príprave na hodinu. Môžete použiť gradio alebo streamlit. +- Vytvorte agenta pre pomoc učiteľovi alebo pedagogickému asistentovi pri príprave na vyučovanie. + Zásobník úloh: -- Vytvorte agenta pre pomoc učiteľovi alebo pedagogickému asistentovi pri príprave na vyučovanie. - Využite školskú infraštruktúru - Zlepšite proces tvorby znalostného grafu. Zlepšite druhy vzájomných vzťahov, zlepšite proces extrakcie. - Vytvorte proces zhlukovania konceptov (pomenovaných entít) -- Vytovrte webové demo pre pomoco pedagógovi pri príprave na hodinu. Môžete použiť gradio alebo streamlit. +- Použite grafovú datagázu Neo4J alebo inú. +- Jeden z možných spôsobov vyhľadávnaia je použitie relačnej dabázy. +- Preštudujte si spôsoby vyhodnotenia RAG - RAGAS, DeepEval a vyhodnnotte systém. Stretnutie 20.2.2026