1
0
forked from KEMT/zpwiki

Compare commits

...

19 Commits

Author SHA1 Message Date
2d07034e35 Update pages/students/2022/oleh_poiasnik/README.md 2026-03-30 13:18:14 +00:00
b602572b97 Update pages/students/2022/oleh_poiasnik/README.md 2026-03-30 13:05:12 +00:00
d9de932595 Update pages/students/2021/matej_scislak/README.md 2026-03-30 12:13:35 +00:00
2dce679f63 Update pages/students/2021/matej_scislak/README.md 2026-03-30 12:06:22 +00:00
bb93e24e0f Update pages/students/2023/oleksandr_dorybohov/README.md 2026-03-23 09:44:19 +00:00
787b2d55f4 Update pages/students/2023/oleksandr_dorybohov/README.md 2026-03-23 09:42:07 +00:00
19b878a71c Update pages/students/2021/martin_sarissky/README.md 2026-03-23 08:47:11 +00:00
c740f5756c zz 2026-03-20 10:21:27 +01:00
d74b9c7862 zz 2026-03-20 09:52:13 +01:00
53362832e9 Merge branch 'master' of git.kemt.fei.tuke.sk:KEMT/zpwiki 2026-03-19 16:41:29 +01:00
7e39c02114 zz 2026-03-19 16:41:21 +01:00
3a79db0090 Update pages/students/2022/oleh_poiasnik/README.md 2026-03-19 10:12:22 +00:00
ae55844e06 Update pages/students/2023/yevhenii_medushivskyi/README.md 2026-03-13 09:07:57 +00:00
816d074fc2 Update pages/students/2023/yevhenii_medushivskyi/README.md 2026-03-13 08:52:16 +00:00
925cbe6da8 Update pages/students/2023/maksym_zatirka/README.md 2026-03-06 13:16:36 +00:00
02bd2f80a8 Update pages/students/2023/maksym_zatirka/README.md 2026-03-06 12:52:26 +00:00
76526659ec Update pages/students/2023/rostyslav_rodzhuk/README.md 2026-03-06 10:43:50 +00:00
8914727cf8 Update pages/students/2022/andrii_pervashov/README.md 2026-03-06 09:35:42 +00:00
cbfa1e7f81 Update pages/students/2022/andrii_pervashov/README.md 2026-03-06 09:34:56 +00:00
9 changed files with 186 additions and 6 deletions

View File

@ -0,0 +1,35 @@
---
title: Bogdan Paul Chiș
published: true
taxonomy:
category: [erasmus]
tag: [nlp, ie, rag, medical]
author: Daniel Hladek
---
ERASMUS Intern Spring 2026, 20 March - 21 May (62 days)
Topic:
(multilingual) Triplet extraction from medical data
Goal:
- Construct a knowledge graph from medical package inserts in multiple languages
- Utilize the graph in an intelligent agent that recommends medication.
Tasks:
- Learn intelligent agents and generative models - OpenAI API, Agent frameworks, RAG systems.
- Learn about knowledge graphs and GraphRAG. Read several research papers.
- Find several existing drug knowledge databases. Identify possible entities and relations.
- Prepare a Python based workflow, use git code repository
- Try Light RAG - Simple RAG.
- Scrape package inserts and parse the data.
- Index the data and write a script that extracts a knowledge graph from data.
- Visualize the graph
- Prepare an agent that utilizes the unstructured data and graph-data.
- Evaluate the agent using DeepEval or RAGAS.
- Write a report
- Put all code to GIT

View File

@ -31,6 +31,23 @@ Ciele:
- Vytvoriť sadu vzorových úloh pre vyhodnotenie takéhoto systému.
- Zlepšiť generovanie odpovedí pre úlohy vyžadujúce viac krokov.
Stretnutie 23.3.2026
Stav:
- Systém funguje.
- Vyhodnotenie Faithfulness, AnswerRelevancy a ContextualRelevancy s databázou otázok a odpovedí od právničky.
- Písomná časť je WIP.
- aktuálne zdrojáky sú k dispozícii na https://git.kemt.fei.tuke.sk/ms058bd/Diplomovka
Úlohy:
- aktualizovať README zdrojákov
- pracovať na texte. Používajte google scholar a odkazy v texte.
- vypracujte viacero experimentov pre rôzne hodnoty hyperparametrov (napr. threshold) a výsledky dajte do tabuľky, príp. grafu.
- Opíšte experimenty - komponenty, dáta, hyperparametre. Slovne zhodnotte výsledky v tabuľkách.
Stretnutie 5.2.2026
- Zväčšený index

View File

@ -30,6 +30,21 @@ Ciele:
- Vytvoriť sadu vzorových úloh pre vyhodnotenie takéhoto systému.
- Zlepšiť generovanie odpovedí pre úlohy vyžadujúce viac krokov pomocou znalostných grafov
Stretnutie 30.3.2025
Stav:
- Vytvorený GraphRAG, skladá sa z FAISS a Neo4J. Neo4J beží lokálne a spája sa so servrom.
- Vytvorené testovanie - 110 otázok. Ku každej otázke je správna odpoveď a odpoveď ktorú generoval chatbot. Sú tam očakávané zdroje a vygenerované zdroje.
Úlohy:
- Nové kódy dajte na GIT.
- Overte možnosti zverejnenia databázy otázok.
- Poromýšľajte o článku.
- Pracujte na texte.
Stretnutie 10.10.2025
Stav:

View File

@ -16,15 +16,33 @@ Návrh na tému:
Prepis reči pre tvorbu štruktúrovaného zdravotného záznamu
Úlohy:
Ciele:
- Vytvorte systém pre prepis reči a naplnenie formulára pomocou lokálnych jazykových modelov
- Dotrénujte jazykový model do slovenskej medicínskej domény
- Zlepšite jazykový model pre extraktiu štruktúrovaných informácií z medicínskej alebo súdnej domény.
Úlohy:
- Oboznámte sa so systémom OpenWebUI - prečítajte si dokumentáciu, príp. spravte si svoju inštanciu.
- Vytvorte jedno alebo viacero rozšírení, ktoré umožnia napňlňať formuláre pomocou rečového vstupu.
- Agent by mal vedieť transformovať rečový vstup do štruktúrovanej podoby.
Teoretické úlohy:
- Oboznámte sa s postupmi pre dotrénovanie jazykového modelu - LORA, PEFT.
- Oboznámte sa s metódami Information Extraction. Vyhľadajte si články na túto tému a napíšte, aké metódy sa používajú. Vstupom je text v prir. jazyku, výstupom je niečo ako JSON.
Zásobník úloh:
- Vyskúšajte ako funguje rozpoznávanie reči cez OPeWEBUI. Navrhnute zlepšenia.
- Ako vieme zistiť, ktoré informácie nám chýbajú?
## Bakalárska práca 2025
Návrh na tému:
Korekcia textu pomocou neurónových sietí

View File

@ -18,6 +18,38 @@ Expertný agentový systém na podporu rozhodovania v lekárni
Cieľ:
- Vylepšiť agenta pre prácu so znalostným grafom - interakcie a kontraindikácie.
- Zostaviť znalostný graf z databázy príbalových letákov adc a s jeho pomocou zlepšiť generovanie odpovede.
Úlohy:
- Oboznámte sa s pojmami na stránke https://graphrag.com/concepts/intro-to-graphrag/ . Napíšte is poznámky.
- Vyskúšajte si softvér https://github.com/hkuds/lightrag .
- Prečítajte si článok LightRAG: Simple and Fast Retrieval-Augmented Generation
- Oboznámte sa so systémom https://docs.ragas.io/en/stable/
Zásobník úloh:
- Využite školské LLM prístupné cez API.
- Pripravte skripty pre získanie (scarpovanie) databázy ADC.
- Zlepšite proces parsovania do formátu JSON. Môžete použiť systém Docling.
Stretnutie 30.3.
Stav:
- Oboznámenie sa s LightRAG.
- Vyskúšané s lokálnym minilm-paraphrase a openwebui tukekemt API.
Úlohy:
- Pripravte skripty pre získanie (scrapovanie) databázy ADC.
- Zlepšite proces parsovania do formátu JSON. Môžete použiť systém Docling.
- Skripty dajte na GIT.
- Vypracujte prehľad článkov zameraných na tvorbu znalostného grafu alebo exťrakcie štruktúrovaných informácií z medicínskych dát.
- Zistite, ktoré entity sú dôležité pre databázu liekov.
# Bakalárska práca 2025

View File

@ -30,9 +30,30 @@ Zadanie:
Ciele:
Vytvorte databázu pre vyhľadávanie v právnych predpisoch s využitím grafovej informácie.
Stretnutie 6.3.
- Parser vie rozparsovať zákony na paragrafy a odseky, vie verzie zákonov.
- Máme jednoduchého agenta, ktorý vie pracovať s grafovou databázou.
Úlohy:
- Pripravte vzorovú datababázy zákonov - nemusia byť všetky a vložte ju do grafovej databázy..
- Pripravte viacero testovacích scenárov pre vyhľadávanie v zákonoch. Scenár by mal byť vo forme otázky.
- Agent by mal podľa otázky vyhľadať relevatné a súvisiace paragrafy v databáze a vygenerovať odpoveď podľa paragrafov.
- Zobrazte aj zoznam zdrojov - relevantnej časti znalostného grafu.
- Kódy dajte na GIT. Mal by tam byť parser. Aj agent. Aj stručná dokumentácia.
- Pracujte na teoretickej časti práce. Napíšte o metódach GraphRAG. Používajte články z Google Scholar. Opíšte metódu zostavenia znalostného grafu, grafovú databázu aj architektúru agenta. Opíšte výsledky experimentov v testovacích scenároch.
Zásobník úloh:
- Pripravte pekné webové rozhranie.
- Pripravte deployment Vašej aplikácie - dockerfile a docker compose.
Stretnutie 4.2.

View File

@ -36,7 +36,25 @@ Spolupráca:
- Projekt [Právne informácie](/topics/legal).
Stretnutie 19.12.
Stretnutie 23.3.2026
Stav:
- Agent funguje.
- Text je v príprave.
Úlohy:
- Pracujte na texte práce. Používajte google scholar a odkazy v texte.
- Rozšírte rozhranie pre prácu s verejným API.
- Vytvorte MCP server pre prácu s verejným API.
- Pripravte kódy na nasadenie pomocou Docker. Upravte konfiguráciu aby sa aplikácia dala používať s rôznymi modelmi cez OpenAI API. Môžete použiť LiteLLM.
- Do práce opíšte rôzne scenáre použitia. Porovnajte aj viac jazykových modelov. Ako vedia iné jazykovvé modely spolupracovať s OpenAI Agents SDK?
Stretnutie 19.12.2025
Stav:

View File

@ -37,6 +37,17 @@ https://github.com/RostikRd/bp2026
- Pozrite si opatrenia na https://podporneopatrenia.minedu.sk/katalog-podpornych-opatreni/ a vyberte relevantné dokumenty
- Vytvorte inteligentného agenta, ktorý by na základe dokumentov navrhol najlepšie výchovné opatrenia.
Stretnutie 6.3.
Stav:
- Prezentovaná teoretická časť
Úlohy:
- Pokračujte v písaní.
- Dajte zdrojáky na GIT.
Stretnutie 6.2.2026
Stav:

View File

@ -24,6 +24,20 @@ Zadanie:
3. Pomocou crawlera získajte dáta z internetu a vytvorte korpus dát pre viaceré domény.
4. Analyzujte získané dáta, priebeh ich sťahovania a navrhnite zlepšenia procesu získavania textových dát.
Stretnutie 13.3.2025
Stav:
- Zozbieraných cca 450MB textu.
- Vylepšený text BP
Úlohy:
- Pridajte funciu "dolovania" domén zo získaného textu.
- Dajte kódy na GIT
- Pokračujte v dolovaní textu, min. 5GB
- zlepšite deduplikáciu a boilereplate removal - napr. justext.
Stretnutie 4.2.2025
Stav:
@ -39,7 +53,6 @@ Stav:
Stretnutie 18.12.2025
Stav: