Compare commits
No commits in common. "master" and "master" have entirely different histories.
@ -1,35 +0,0 @@
|
|||||||
---
|
|
||||||
title: Bogdan Paul Chiș
|
|
||||||
published: true
|
|
||||||
taxonomy:
|
|
||||||
category: [erasmus]
|
|
||||||
tag: [nlp, ie, rag, medical]
|
|
||||||
author: Daniel Hladek
|
|
||||||
---
|
|
||||||
|
|
||||||
ERASMUS Intern Spring 2026, 20 March - 21 May (62 days)
|
|
||||||
|
|
||||||
Topic:
|
|
||||||
|
|
||||||
(multilingual) Triplet extraction from medical data
|
|
||||||
|
|
||||||
Goal:
|
|
||||||
|
|
||||||
- Construct a knowledge graph from medical package inserts in multiple languages
|
|
||||||
- Utilize the graph in an intelligent agent that recommends medication.
|
|
||||||
|
|
||||||
Tasks:
|
|
||||||
|
|
||||||
- Learn intelligent agents and generative models - OpenAI API, Agent frameworks, RAG systems.
|
|
||||||
- Learn about knowledge graphs and GraphRAG. Read several research papers.
|
|
||||||
- Find several existing drug knowledge databases. Identify possible entities and relations.
|
|
||||||
- Prepare a Python based workflow, use git code repository
|
|
||||||
- Try Light RAG - Simple RAG.
|
|
||||||
- Scrape package inserts and parse the data.
|
|
||||||
- Index the data and write a script that extracts a knowledge graph from data.
|
|
||||||
- Visualize the graph
|
|
||||||
- Prepare an agent that utilizes the unstructured data and graph-data.
|
|
||||||
- Evaluate the agent using DeepEval or RAGAS.
|
|
||||||
- Write a report
|
|
||||||
- Put all code to GIT
|
|
||||||
|
|
||||||
@ -31,23 +31,6 @@ Ciele:
|
|||||||
- Vytvoriť sadu vzorových úloh pre vyhodnotenie takéhoto systému.
|
- Vytvoriť sadu vzorových úloh pre vyhodnotenie takéhoto systému.
|
||||||
- Zlepšiť generovanie odpovedí pre úlohy vyžadujúce viac krokov.
|
- Zlepšiť generovanie odpovedí pre úlohy vyžadujúce viac krokov.
|
||||||
|
|
||||||
Stretnutie 23.3.2026
|
|
||||||
|
|
||||||
Stav:
|
|
||||||
|
|
||||||
- Systém funguje.
|
|
||||||
- Vyhodnotenie Faithfulness, AnswerRelevancy a ContextualRelevancy s databázou otázok a odpovedí od právničky.
|
|
||||||
- Písomná časť je WIP.
|
|
||||||
- aktuálne zdrojáky sú k dispozícii na https://git.kemt.fei.tuke.sk/ms058bd/Diplomovka
|
|
||||||
|
|
||||||
Úlohy:
|
|
||||||
|
|
||||||
- aktualizovať README zdrojákov
|
|
||||||
- pracovať na texte. Používajte google scholar a odkazy v texte.
|
|
||||||
- vypracujte viacero experimentov pre rôzne hodnoty hyperparametrov (napr. threshold) a výsledky dajte do tabuľky, príp. grafu.
|
|
||||||
- Opíšte experimenty - komponenty, dáta, hyperparametre. Slovne zhodnotte výsledky v tabuľkách.
|
|
||||||
|
|
||||||
|
|
||||||
Stretnutie 5.2.2026
|
Stretnutie 5.2.2026
|
||||||
|
|
||||||
- Zväčšený index
|
- Zväčšený index
|
||||||
|
|||||||
@ -30,21 +30,6 @@ Ciele:
|
|||||||
- Vytvoriť sadu vzorových úloh pre vyhodnotenie takéhoto systému.
|
- Vytvoriť sadu vzorových úloh pre vyhodnotenie takéhoto systému.
|
||||||
- Zlepšiť generovanie odpovedí pre úlohy vyžadujúce viac krokov pomocou znalostných grafov
|
- Zlepšiť generovanie odpovedí pre úlohy vyžadujúce viac krokov pomocou znalostných grafov
|
||||||
|
|
||||||
Stretnutie 30.3.2025
|
|
||||||
|
|
||||||
Stav:
|
|
||||||
|
|
||||||
- Vytvorený GraphRAG, skladá sa z FAISS a Neo4J. Neo4J beží lokálne a spája sa so servrom.
|
|
||||||
- Vytvorené testovanie - 110 otázok. Ku každej otázke je správna odpoveď a odpoveď ktorú generoval chatbot. Sú tam očakávané zdroje a vygenerované zdroje.
|
|
||||||
|
|
||||||
Úlohy:
|
|
||||||
|
|
||||||
- Nové kódy dajte na GIT.
|
|
||||||
- Overte možnosti zverejnenia databázy otázok.
|
|
||||||
- Poromýšľajte o článku.
|
|
||||||
- Pracujte na texte.
|
|
||||||
|
|
||||||
|
|
||||||
Stretnutie 10.10.2025
|
Stretnutie 10.10.2025
|
||||||
|
|
||||||
Stav:
|
Stav:
|
||||||
|
|||||||
@ -16,33 +16,15 @@ Návrh na tému:
|
|||||||
|
|
||||||
Prepis reči pre tvorbu štruktúrovaného zdravotného záznamu
|
Prepis reči pre tvorbu štruktúrovaného zdravotného záznamu
|
||||||
|
|
||||||
Ciele:
|
|
||||||
|
|
||||||
- Vytvorte systém pre prepis reči a naplnenie formulára pomocou lokálnych jazykových modelov
|
|
||||||
- Zlepšite jazykový model pre extraktiu štruktúrovaných informácií z medicínskej alebo súdnej domény.
|
|
||||||
|
|
||||||
Úlohy:
|
Úlohy:
|
||||||
|
|
||||||
- Oboznámte sa so systémom OpenWebUI - prečítajte si dokumentáciu, príp. spravte si svoju inštanciu.
|
- Vytvorte systém pre prepis reči a naplnenie formulára pomocou lokálnych jazykových modelov
|
||||||
- Vytvorte jedno alebo viacero rozšírení, ktoré umožnia napňlňať formuláre pomocou rečového vstupu.
|
- Dotrénujte jazykový model do slovenskej medicínskej domény
|
||||||
- Agent by mal vedieť transformovať rečový vstup do štruktúrovanej podoby.
|
|
||||||
|
|
||||||
Teoretické úlohy:
|
|
||||||
|
|
||||||
- Oboznámte sa s postupmi pre dotrénovanie jazykového modelu - LORA, PEFT.
|
|
||||||
- Oboznámte sa s metódami Information Extraction. Vyhľadajte si články na túto tému a napíšte, aké metódy sa používajú. Vstupom je text v prir. jazyku, výstupom je niečo ako JSON.
|
|
||||||
|
|
||||||
|
|
||||||
Zásobník úloh:
|
|
||||||
- Vyskúšajte ako funguje rozpoznávanie reči cez OPeWEBUI. Navrhnute zlepšenia.
|
|
||||||
- Ako vieme zistiť, ktoré informácie nám chýbajú?
|
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
## Bakalárska práca 2025
|
## Bakalárska práca 2025
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
Návrh na tému:
|
Návrh na tému:
|
||||||
|
|
||||||
Korekcia textu pomocou neurónových sietí
|
Korekcia textu pomocou neurónových sietí
|
||||||
|
|||||||
@ -18,38 +18,6 @@ Expertný agentový systém na podporu rozhodovania v lekárni
|
|||||||
Cieľ:
|
Cieľ:
|
||||||
|
|
||||||
- Vylepšiť agenta pre prácu so znalostným grafom - interakcie a kontraindikácie.
|
- Vylepšiť agenta pre prácu so znalostným grafom - interakcie a kontraindikácie.
|
||||||
- Zostaviť znalostný graf z databázy príbalových letákov adc a s jeho pomocou zlepšiť generovanie odpovede.
|
|
||||||
|
|
||||||
Úlohy:
|
|
||||||
|
|
||||||
- Oboznámte sa s pojmami na stránke https://graphrag.com/concepts/intro-to-graphrag/ . Napíšte is poznámky.
|
|
||||||
- Vyskúšajte si softvér https://github.com/hkuds/lightrag .
|
|
||||||
- Prečítajte si článok LightRAG: Simple and Fast Retrieval-Augmented Generation
|
|
||||||
- Oboznámte sa so systémom https://docs.ragas.io/en/stable/
|
|
||||||
|
|
||||||
Zásobník úloh:
|
|
||||||
|
|
||||||
- Využite školské LLM prístupné cez API.
|
|
||||||
- Pripravte skripty pre získanie (scarpovanie) databázy ADC.
|
|
||||||
- Zlepšite proces parsovania do formátu JSON. Môžete použiť systém Docling.
|
|
||||||
|
|
||||||
|
|
||||||
Stretnutie 30.3.
|
|
||||||
|
|
||||||
|
|
||||||
Stav:
|
|
||||||
|
|
||||||
- Oboznámenie sa s LightRAG.
|
|
||||||
- Vyskúšané s lokálnym minilm-paraphrase a openwebui tukekemt API.
|
|
||||||
|
|
||||||
Úlohy:
|
|
||||||
|
|
||||||
- Pripravte skripty pre získanie (scrapovanie) databázy ADC.
|
|
||||||
- Zlepšite proces parsovania do formátu JSON. Môžete použiť systém Docling.
|
|
||||||
- Skripty dajte na GIT.
|
|
||||||
- Vypracujte prehľad článkov zameraných na tvorbu znalostného grafu alebo exťrakcie štruktúrovaných informácií z medicínskych dát.
|
|
||||||
- Zistite, ktoré entity sú dôležité pre databázu liekov.
|
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
# Bakalárska práca 2025
|
# Bakalárska práca 2025
|
||||||
|
|||||||
@ -11,45 +11,6 @@ rok začiatku štúdia: 2022
|
|||||||
|
|
||||||
# Diplomová práca 2027
|
# Diplomová práca 2027
|
||||||
|
|
||||||
Zlepšenie vyhľadávania pomocou znalostných grafov.
|
|
||||||
|
|
||||||
Myšlienky:
|
|
||||||
|
|
||||||
- Agent si buduje vnútornú reprezentáciu pomocu ktorej vie lepšie generovať.
|
|
||||||
- Vnútorná reprezentácia je v človeku zrozumiteľnej podobe, napr. znalostný graf.
|
|
||||||
|
|
||||||
Možné úlohy:
|
|
||||||
|
|
||||||
- Navrhnite agenta, ktorý bude budovať a využívať znalostný graf pri vyhľadávaní.
|
|
||||||
- Môže to byť v oblasti vzdelávania, práva alebo medicíny.
|
|
||||||
|
|
||||||
Existujúca práca:
|
|
||||||
|
|
||||||
- LightRAG - pozrite si to.
|
|
||||||
|
|
||||||
Nápady na prínos:
|
|
||||||
|
|
||||||
- navrhnite spôsob automatického budovania znalostného grafu vo zvolenej doméne.
|
|
||||||
- navrhnite spôsob vyhľadávania s pomocou existujúceho znalostného grafu.
|
|
||||||
- dotrénujte jazykový model alebo navrhnite metódu promptovania pre tvorbyu znalostných grafov z dát.
|
|
||||||
- navrhnite metódu pre dotrénovanie jazykového modelu s pomocou znalostného grafu
|
|
||||||
- augmentácia modelu s pomocou znalostného grafu.
|
|
||||||
|
|
||||||
Úlohy:
|
|
||||||
|
|
||||||
- Naštudujte si problematiku.
|
|
||||||
- Získajte vzorový znalostný graf ktorý sa bude dať použiť pri výskume.
|
|
||||||
- Vytvorte jednoduché demo, ktoré bude demonštrovať využitie znalostného grafu pri vyhľadávaní.
|
|
||||||
- Na právnych dátach pracujú kolegovia Šarišský a Ščišľak. Spracovali Právny Thesaurus.
|
|
||||||
- Na lekárskych dátach pracuje doc. Bednár. Z toho sa da vytiahnuť znalostný graf.
|
|
||||||
- Na dátach zo vzdelávania pracuje vedúci - máme ZPWIKI.
|
|
||||||
|
|
||||||
|
|
||||||
# Diplomový projekt 2026
|
|
||||||
|
|
||||||
Projekt odložený.
|
|
||||||
|
|
||||||
|
|
||||||
Augmentácia dát pre zlepšenie získavania informácií
|
Augmentácia dát pre zlepšenie získavania informácií
|
||||||
|
|
||||||
|
|
||||||
|
|||||||
@ -30,30 +30,9 @@ Zadanie:
|
|||||||
Ciele:
|
Ciele:
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
Vytvorte databázu pre vyhľadávanie v právnych predpisoch s využitím grafovej informácie.
|
Vytvorte databázu pre vyhľadávanie v právnych predpisoch s využitím grafovej informácie.
|
||||||
|
|
||||||
Stretnutie 6.3.
|
|
||||||
|
|
||||||
- Parser vie rozparsovať zákony na paragrafy a odseky, vie verzie zákonov.
|
|
||||||
- Máme jednoduchého agenta, ktorý vie pracovať s grafovou databázou.
|
|
||||||
|
|
||||||
Úlohy:
|
|
||||||
|
|
||||||
- Pripravte vzorovú datababázy zákonov - nemusia byť všetky a vložte ju do grafovej databázy..
|
|
||||||
- Pripravte viacero testovacích scenárov pre vyhľadávanie v zákonoch. Scenár by mal byť vo forme otázky.
|
|
||||||
- Agent by mal podľa otázky vyhľadať relevatné a súvisiace paragrafy v databáze a vygenerovať odpoveď podľa paragrafov.
|
|
||||||
- Zobrazte aj zoznam zdrojov - relevantnej časti znalostného grafu.
|
|
||||||
- Kódy dajte na GIT. Mal by tam byť parser. Aj agent. Aj stručná dokumentácia.
|
|
||||||
- Pracujte na teoretickej časti práce. Napíšte o metódach GraphRAG. Používajte články z Google Scholar. Opíšte metódu zostavenia znalostného grafu, grafovú databázu aj architektúru agenta. Opíšte výsledky experimentov v testovacích scenároch.
|
|
||||||
|
|
||||||
|
|
||||||
Zásobník úloh:
|
|
||||||
|
|
||||||
- Pripravte pekné webové rozhranie.
|
|
||||||
- Pripravte deployment Vašej aplikácie - dockerfile a docker compose.
|
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
Stretnutie 4.2.
|
Stretnutie 4.2.
|
||||||
|
|
||||||
|
|||||||
@ -36,25 +36,7 @@ Spolupráca:
|
|||||||
|
|
||||||
- Projekt [Právne informácie](/topics/legal).
|
- Projekt [Právne informácie](/topics/legal).
|
||||||
|
|
||||||
|
Stretnutie 19.12.
|
||||||
Stretnutie 23.3.2026
|
|
||||||
|
|
||||||
|
|
||||||
Stav:
|
|
||||||
|
|
||||||
- Agent funguje.
|
|
||||||
- Text je v príprave.
|
|
||||||
|
|
||||||
Úlohy:
|
|
||||||
|
|
||||||
- Pracujte na texte práce. Používajte google scholar a odkazy v texte.
|
|
||||||
- Rozšírte rozhranie pre prácu s verejným API.
|
|
||||||
- Vytvorte MCP server pre prácu s verejným API.
|
|
||||||
- Pripravte kódy na nasadenie pomocou Docker. Upravte konfiguráciu aby sa aplikácia dala používať s rôznymi modelmi cez OpenAI API. Môžete použiť LiteLLM.
|
|
||||||
- Do práce opíšte rôzne scenáre použitia. Porovnajte aj viac jazykových modelov. Ako vedia iné jazykovvé modely spolupracovať s OpenAI Agents SDK?
|
|
||||||
|
|
||||||
|
|
||||||
Stretnutie 19.12.2025
|
|
||||||
|
|
||||||
Stav:
|
Stav:
|
||||||
|
|
||||||
|
|||||||
@ -22,8 +22,6 @@ Téma:
|
|||||||
Skórovací online systém pre robotické súťaže
|
Skórovací online systém pre robotické súťaže
|
||||||
|
|
||||||
|
|
||||||
https://git.kemt.fei.tuke.sk/rz409st/scoring-system/src/branch/main/backend
|
|
||||||
|
|
||||||
Ciele:
|
Ciele:
|
||||||
|
|
||||||
- Vypracujte prehľad robotických súťaží a podporného softvéru pre robotické súťaže.
|
- Vypracujte prehľad robotických súťaží a podporného softvéru pre robotické súťaže.
|
||||||
|
|||||||
@ -37,17 +37,6 @@ https://github.com/RostikRd/bp2026
|
|||||||
- Pozrite si opatrenia na https://podporneopatrenia.minedu.sk/katalog-podpornych-opatreni/ a vyberte relevantné dokumenty
|
- Pozrite si opatrenia na https://podporneopatrenia.minedu.sk/katalog-podpornych-opatreni/ a vyberte relevantné dokumenty
|
||||||
- Vytvorte inteligentného agenta, ktorý by na základe dokumentov navrhol najlepšie výchovné opatrenia.
|
- Vytvorte inteligentného agenta, ktorý by na základe dokumentov navrhol najlepšie výchovné opatrenia.
|
||||||
|
|
||||||
Stretnutie 6.3.
|
|
||||||
|
|
||||||
Stav:
|
|
||||||
|
|
||||||
- Prezentovaná teoretická časť
|
|
||||||
|
|
||||||
Úlohy:
|
|
||||||
|
|
||||||
- Pokračujte v písaní.
|
|
||||||
- Dajte zdrojáky na GIT.
|
|
||||||
|
|
||||||
Stretnutie 6.2.2026
|
Stretnutie 6.2.2026
|
||||||
|
|
||||||
Stav:
|
Stav:
|
||||||
|
|||||||
@ -24,20 +24,6 @@ Zadanie:
|
|||||||
3. Pomocou crawlera získajte dáta z internetu a vytvorte korpus dát pre viaceré domény.
|
3. Pomocou crawlera získajte dáta z internetu a vytvorte korpus dát pre viaceré domény.
|
||||||
4. Analyzujte získané dáta, priebeh ich sťahovania a navrhnite zlepšenia procesu získavania textových dát.
|
4. Analyzujte získané dáta, priebeh ich sťahovania a navrhnite zlepšenia procesu získavania textových dát.
|
||||||
|
|
||||||
Stretnutie 13.3.2025
|
|
||||||
|
|
||||||
Stav:
|
|
||||||
|
|
||||||
- Zozbieraných cca 450MB textu.
|
|
||||||
- Vylepšený text BP
|
|
||||||
|
|
||||||
Úlohy:
|
|
||||||
|
|
||||||
- Pridajte funciu "dolovania" domén zo získaného textu.
|
|
||||||
- Dajte kódy na GIT
|
|
||||||
- Pokračujte v dolovaní textu, min. 5GB
|
|
||||||
- zlepšite deduplikáciu a boilereplate removal - napr. justext.
|
|
||||||
|
|
||||||
Stretnutie 4.2.2025
|
Stretnutie 4.2.2025
|
||||||
|
|
||||||
Stav:
|
Stav:
|
||||||
@ -53,6 +39,7 @@ Stav:
|
|||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
Stretnutie 18.12.2025
|
Stretnutie 18.12.2025
|
||||||
|
|
||||||
Stav:
|
Stav:
|
||||||
|
|||||||
Loading…
Reference in New Issue
Block a user