diff --git a/pages/students/2022/jan_malinovsky/README.md b/pages/students/2022/jan_malinovsky/README.md index 8d653760..79695752 100644 --- a/pages/students/2022/jan_malinovsky/README.md +++ b/pages/students/2022/jan_malinovsky/README.md @@ -47,6 +47,11 @@ Zdroje doumentov: - https://www.minedu.sk/pedagogicky-asistent-podporne-opatrenie/ - https://podporneopatrenia.minedu.sk/katalog-podpornych-opatreni/ +- Extrahovaný text pomocou pypdf a docx. Sú tam aj excel tabuľky, ale tie nie sú extrahované. +- Text sa rozdelí na chunky (cca 8000 znakov), vypočíta sa hash na deduplikáciu. +- Pomocou LM sa dokument transformtuje na JSON. Z dokumentu LLM extrahuje "vzdelávacie koncepty" a vzťahy medzi nimi. Vzťahy sú z určenej množiny typu "implements", "depends on", "teaches", "requires". +- Výsledok sa zobrazí vo forme grafu. + Stretnutie 20.2.2026