forked from KEMT/zpwiki
Compare commits
39 Commits
42edf41ba7
...
3e892a1d49
| Author | SHA1 | Date | |
|---|---|---|---|
| 3e892a1d49 | |||
| f3d012f7a3 | |||
| b326bafbd5 | |||
| 10b54fac72 | |||
| 32eb8ce894 | |||
| 5c57e068c1 | |||
| 8350c811a8 | |||
| bd97a84f62 | |||
| 1d4fe226c5 | |||
| e4dfe39bfc | |||
| 07c864e507 | |||
| 94b6ae05c8 | |||
| 1757237dbd | |||
| 13743a6120 | |||
| e4d17b9621 | |||
| 27000de78a | |||
| 1ddd7fbcb8 | |||
| bc885eaa31 | |||
| ef1dc1e424 | |||
| 739675d1fe | |||
| 2d07034e35 | |||
| b602572b97 | |||
| d9de932595 | |||
| 2dce679f63 | |||
| bb93e24e0f | |||
| 787b2d55f4 | |||
| 19b878a71c | |||
| c740f5756c | |||
| d74b9c7862 | |||
| 53362832e9 | |||
| 7e39c02114 | |||
| 3a79db0090 | |||
| ae55844e06 | |||
| 816d074fc2 | |||
| 925cbe6da8 | |||
| 02bd2f80a8 | |||
| 76526659ec | |||
| 8914727cf8 | |||
| cbfa1e7f81 |
45
pages/interns/bogdan_paul_chis/README.md
Normal file
45
pages/interns/bogdan_paul_chis/README.md
Normal file
@ -0,0 +1,45 @@
|
||||
---
|
||||
title: Bogdan Paul Chiș
|
||||
published: true
|
||||
taxonomy:
|
||||
category: [erasmus]
|
||||
tag: [nlp, ie, rag, medical]
|
||||
author: Daniel Hladek
|
||||
---
|
||||
|
||||
ERASMUS Intern Spring 2026, 20 March - 21 May (62 days)
|
||||
|
||||
Topic:
|
||||
|
||||
(multilingual) Triplet extraction from medical data
|
||||
|
||||
Goal:
|
||||
|
||||
- Construct a knowledge graph from medical package inserts in multiple languages
|
||||
- Utilize the graph in an intelligent agent that recommends medication.
|
||||
|
||||
Tasks:
|
||||
|
||||
- Learn intelligent agents and generative models - OpenAI API, Agent frameworks, RAG systems.
|
||||
- Learn about knowledge graphs and GraphRAG. Read several research papers.
|
||||
- Find several existing drug knowledge databases. Identify possible entities and relations.
|
||||
- Prepare a Python based workflow, use git code repository
|
||||
- Try Light RAG - Simple RAG.
|
||||
- Scrape package inserts and parse the data.
|
||||
- Index the data and write a script that extracts a knowledge graph from data.
|
||||
- Visualize the graph
|
||||
- Prepare an agent that utilizes the unstructured data and graph-data.
|
||||
- Evaluate the agent using DeepEval or RAGAS.
|
||||
- Write a report
|
||||
- Put all code to GIT
|
||||
|
||||
Meeting 18.5.2026
|
||||
|
||||
State:
|
||||
|
||||
All tasks finished.
|
||||
|
||||
Repository with outputs:
|
||||
|
||||
https://github.com/chis-facultate/erasmus-kosice
|
||||
|
||||
@ -31,6 +31,23 @@ Ciele:
|
||||
- Vytvoriť sadu vzorových úloh pre vyhodnotenie takéhoto systému.
|
||||
- Zlepšiť generovanie odpovedí pre úlohy vyžadujúce viac krokov.
|
||||
|
||||
Stretnutie 23.3.2026
|
||||
|
||||
Stav:
|
||||
|
||||
- Systém funguje.
|
||||
- Vyhodnotenie Faithfulness, AnswerRelevancy a ContextualRelevancy s databázou otázok a odpovedí od právničky.
|
||||
- Písomná časť je WIP.
|
||||
- aktuálne zdrojáky sú k dispozícii na https://git.kemt.fei.tuke.sk/ms058bd/Diplomovka
|
||||
|
||||
Úlohy:
|
||||
|
||||
- aktualizovať README zdrojákov
|
||||
- pracovať na texte. Používajte google scholar a odkazy v texte.
|
||||
- vypracujte viacero experimentov pre rôzne hodnoty hyperparametrov (napr. threshold) a výsledky dajte do tabuľky, príp. grafu.
|
||||
- Opíšte experimenty - komponenty, dáta, hyperparametre. Slovne zhodnotte výsledky v tabuľkách.
|
||||
|
||||
|
||||
Stretnutie 5.2.2026
|
||||
|
||||
- Zväčšený index
|
||||
|
||||
@ -30,6 +30,23 @@ Ciele:
|
||||
- Vytvoriť sadu vzorových úloh pre vyhodnotenie takéhoto systému.
|
||||
- Zlepšiť generovanie odpovedí pre úlohy vyžadujúce viac krokov pomocou znalostných grafov
|
||||
|
||||
Repozitár: https://git.kemt.fei.tuke.sk/ms252gb/DP2026
|
||||
|
||||
Stretnutie 30.3.2025
|
||||
|
||||
Stav:
|
||||
|
||||
- Vytvorený GraphRAG, skladá sa z FAISS a Neo4J. Neo4J beží lokálne a spája sa so servrom.
|
||||
- Vytvorené testovanie - 110 otázok. Ku každej otázke je správna odpoveď a odpoveď ktorú generoval chatbot. Sú tam očakávané zdroje a vygenerované zdroje.
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Nové kódy dajte na GIT.
|
||||
- Overte možnosti zverejnenia databázy otázok.
|
||||
- Poromýšľajte o článku.
|
||||
- Pracujte na texte.
|
||||
|
||||
|
||||
Stretnutie 10.10.2025
|
||||
|
||||
Stav:
|
||||
|
||||
@ -16,15 +16,33 @@ Návrh na tému:
|
||||
|
||||
Prepis reči pre tvorbu štruktúrovaného zdravotného záznamu
|
||||
|
||||
Úlohy:
|
||||
Ciele:
|
||||
|
||||
- Vytvorte systém pre prepis reči a naplnenie formulára pomocou lokálnych jazykových modelov
|
||||
- Dotrénujte jazykový model do slovenskej medicínskej domény
|
||||
- Zlepšite jazykový model pre extraktiu štruktúrovaných informácií z medicínskej alebo súdnej domény.
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Oboznámte sa so systémom OpenWebUI - prečítajte si dokumentáciu, príp. spravte si svoju inštanciu.
|
||||
- Vytvorte jedno alebo viacero rozšírení, ktoré umožnia napňlňať formuláre pomocou rečového vstupu.
|
||||
- Agent by mal vedieť transformovať rečový vstup do štruktúrovanej podoby.
|
||||
|
||||
Teoretické úlohy:
|
||||
|
||||
- Oboznámte sa s postupmi pre dotrénovanie jazykového modelu - LORA, PEFT.
|
||||
- Oboznámte sa s metódami Information Extraction. Vyhľadajte si články na túto tému a napíšte, aké metódy sa používajú. Vstupom je text v prir. jazyku, výstupom je niečo ako JSON.
|
||||
|
||||
|
||||
Zásobník úloh:
|
||||
- Vyskúšajte ako funguje rozpoznávanie reči cez OPeWEBUI. Navrhnute zlepšenia.
|
||||
- Ako vieme zistiť, ktoré informácie nám chýbajú?
|
||||
|
||||
|
||||
|
||||
|
||||
## Bakalárska práca 2025
|
||||
|
||||
|
||||
|
||||
Návrh na tému:
|
||||
|
||||
Korekcia textu pomocou neurónových sietí
|
||||
|
||||
@ -31,6 +31,56 @@ Napr.
|
||||
- osnovy pre výuku na základnej škole.
|
||||
- spôsoby práce asistenta pedagóga.
|
||||
|
||||
Stretnutie 14.5.2026
|
||||
|
||||
Stav:
|
||||
|
||||
- Preštudované materiály podľa pokynov nižšie .
|
||||
- Získané dokumenty - osnovy pre pre základné školy: slovenčina, matematika, angličtina, informatika, fyzika, biológia, občianska náuka, telesná výchova, chémia pre všetky ročníky.
|
||||
- Extrahovaný text pomocou pypdf a docx. Sú tam aj excel tabuľky, ale tie nie sú extrahované.
|
||||
- Text sa rozdelí na chunky (cca 8000 znakov), vypočíta sa hash na deduplikáciu.
|
||||
- Pomocou LM sa dokument transformtuje na JSON. Z dokumentu LLM extrahuje "vzdelávacie koncepty" a vzťahy medzi nimi. Vzťahy sú z určenej množiny typu "implements", "depends on", "teaches", "requires".
|
||||
- Výsledok sa zobrazí vo forme grafu.
|
||||
- Vytvorený jednoduchý agent, ktorý vyhľadáva v znalostnom grafe a na základe týchto informácií generuje odpoveď.
|
||||
|
||||
|
||||
|
||||
Zdroje doumentov:
|
||||
|
||||
- https://www.minedu.sk/vzdelavacie-standardy-pre-1-stupen-zs/
|
||||
- https://www.minedu.sk/vzdelavacie-standardy-pre-2-stupen-zs/
|
||||
- https://podporneopatrenia.minedu.sk/zabezpecenie-posobenia-pedagogickeho-asistenta-v-triede/
|
||||
- https://www.upsvr.gov.sk/socialne-veci-a-rodina/rodina/opatrenia-socialnopravnej-ochrany-deti-a-socialnej-kurately/socialno-pravna-ochrana-deti/opatrenia-na-zabezpecenie-ochrany-zivota-zdravia-a-vyvinu-dietata/vychovne-opatrenia.html?page_id=1205
|
||||
- https://www.minedu.sk/pedagogicky-asistent-podporne-opatrenie/
|
||||
- https://podporneopatrenia.minedu.sk/katalog-podpornych-opatreni/
|
||||
|
||||
|
||||
Úlohy:
|
||||
|
||||
- *dajte zdrojové kódy na GIT*.
|
||||
|
||||
Týka sa ďalšieho obdobia:
|
||||
|
||||
- Pozrite si https://github.com/hkuds/minirag . Prečítajte si článok, vyskúšajte zdrojové kódy s dátami ktoré máte.
|
||||
- Pozrite si https://github.com/HKUDS/LightRAG. Prečítajte si článok, pozrite zdrojové kódy, môžete aj vyskúšať.
|
||||
- Preštudujte si jazyk Cypher.
|
||||
- Preštudujte si embedding modely a vektorové databázy, napr. ChromaDB a multilingual e5-large.
|
||||
- Pokračujte štúdiu GraphRAG:
|
||||
- Vytovrte webové demo pre pomoco pedagógovi pri príprave na hodinu. Môžete použiť gradio alebo streamlit.
|
||||
- Vytvorte agenta pre pomoc učiteľovi alebo pedagogickému asistentovi pri príprave na vyučovanie.
|
||||
|
||||
|
||||
|
||||
Zásobník úloh:
|
||||
|
||||
- Využite školskú infraštruktúru
|
||||
- Zlepšite proces tvorby znalostného grafu. Zlepšite druhy vzájomných vzťahov, zlepšite proces extrakcie.
|
||||
- Vytvorte proces zhlukovania konceptov (pomenovaných entít)
|
||||
- Použite grafovú datagázu Neo4J alebo inú.
|
||||
- Jeden z možných spôsobov vyhľadávnaia je použitie relačnej dabázy.
|
||||
- Preštudujte si spôsoby vyhodnotenia RAG - RAGAS, DeepEval a vyhodnnotte systém.
|
||||
|
||||
|
||||
Stretnutie 20.2.2026
|
||||
|
||||
Úlohy:
|
||||
|
||||
@ -18,6 +18,63 @@ Expertný agentový systém na podporu rozhodovania v lekárni
|
||||
Cieľ:
|
||||
|
||||
- Vylepšiť agenta pre prácu so znalostným grafom - interakcie a kontraindikácie.
|
||||
- Zostaviť znalostný graf z databázy príbalových letákov adc a s jeho pomocou zlepšiť generovanie odpovede.
|
||||
|
||||
Stretnutie 14.5.
|
||||
|
||||
Stav:
|
||||
|
||||
- Získaná databáza ADC pomocou scrapera.
|
||||
- Dáta sú transformované do JSON, je definovaná schéma.
|
||||
- Pomocou LightRAG je vytvorený znalostný graf pre niekoľko (500) liekov.
|
||||
- Prvá verzia agenta na základe LightRAG. Problém je, že znalostný graf je príliš veľký.
|
||||
- Kódy pre extrakciu aj pre krawlera sú na gite, aj konfigurácia spustenia LightRAG.
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Zlepšite vyhľadávanie v znalostnom grafe. Nakonfigurovať LightRAG na databázu Neo4J.
|
||||
- Preskúmajte vzniknutý KG. Nachádzajú sa v ňom duplicitné koncepty alebo vzťahy?
|
||||
- Oboznámte sa so systémom MiniRAG: https://github.com/hkuds/minirag Prečítajte si článok.
|
||||
- Oboznámte sa so systémom RAGAS a DeepEVAL.
|
||||
|
||||
Zásobník úloh:
|
||||
|
||||
- Zostavte databázu vzorových úloh pre vyhodnotenie takéhoto systému a vyberte vhodnú metodiku vyhodnotenia.
|
||||
- Pripravte webové demo. Môžete použiť streamlit alebo gradio.
|
||||
|
||||
|
||||
Stretnutie 30.4.2026
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Oboznámte sa s pojmami na stránke https://graphrag.com/concepts/intro-to-graphrag/ . Napíšte is poznámky.
|
||||
- Vyskúšajte si softvér https://github.com/hkuds/lightrag .
|
||||
- Prečítajte si článok LightRAG: Simple and Fast Retrieval-Augmented Generation
|
||||
- Oboznámte sa so systémom https://docs.ragas.io/en/stable/
|
||||
|
||||
Zásobník úloh:
|
||||
|
||||
- Využite školské LLM prístupné cez API.
|
||||
- Pripravte skripty pre získanie (scarpovanie) databázy ADC.
|
||||
- Zlepšite proces parsovania do formátu JSON. Môžete použiť systém Docling.
|
||||
|
||||
|
||||
Stretnutie 30.3.
|
||||
|
||||
|
||||
Stav:
|
||||
|
||||
- Oboznámenie sa s LightRAG.
|
||||
- Vyskúšané s lokálnym minilm-paraphrase a openwebui tukekemt API.
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Pripravte skripty pre získanie (scrapovanie) databázy ADC.
|
||||
- Zlepšite proces parsovania do formátu JSON. Môžete použiť systém Docling.
|
||||
- Skripty dajte na GIT.
|
||||
- Vypracujte prehľad článkov zameraných na tvorbu znalostného grafu alebo exťrakcie štruktúrovaných informácií z medicínskych dát.
|
||||
- Zistite, ktoré entity sú dôležité pre databázu liekov.
|
||||
|
||||
|
||||
|
||||
# Bakalárska práca 2025
|
||||
|
||||
@ -11,6 +11,64 @@ rok začiatku štúdia: 2022
|
||||
|
||||
# Diplomová práca 2027
|
||||
|
||||
Zlepšenie vyhľadávania pomocou znalostných grafov.
|
||||
|
||||
Myšlienky:
|
||||
|
||||
- Agent si buduje vnútornú reprezentáciu pomocu ktorej vie lepšie generovať.
|
||||
- Vnútorná reprezentácia je v človeku zrozumiteľnej podobe, napr. znalostný graf.
|
||||
|
||||
Možné úlohy:
|
||||
|
||||
- Navrhnite agenta, ktorý bude budovať a využívať znalostný graf pri vyhľadávaní.
|
||||
- Môže to byť v oblasti vzdelávania, práva alebo medicíny.
|
||||
- Zostavte multilinguálny znalostný graf, ktorý môže pomôcť pri generovaní.
|
||||
|
||||
Existujúca práca:
|
||||
|
||||
- LightRAG - pozrite si to.
|
||||
|
||||
|
||||
Stretnutie 15.5.
|
||||
|
||||
Stav:
|
||||
|
||||
- Zaindexované anglické dáta Alice in Wonderland pomocou LightRAG, zostavený znalostný graf z knihy.
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Pozrite sa na systém MiniRAG
|
||||
- Získajte texty Alice in Wonderland v iných jazykoch - napr. po rusky a po slovensky. Zostavte multilinguálny znalostný graf.
|
||||
- Prečítajte si najnovšie vedecké články na tému "multilingual knowledge graph construction", "multilingual entity linking (alignment)". Urobte si poznámky o spôsoboch ako urobiť takýto graf a ako ho využiť pri vyhľadávaní.
|
||||
|
||||
|
||||
|
||||
Stretnutie 27.4.
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Naštudujte si problematiku.
|
||||
- Získajte vzorový znalostný graf ktorý sa bude dať použiť pri výskume.
|
||||
- Vytvorte jednoduché demo, ktoré bude demonštrovať využitie znalostného grafu pri vyhľadávaní.
|
||||
- Na právnych dátach pracujú kolegovia Šarišský a Ščišľak. Spracovali Právny Thesaurus.
|
||||
- Na lekárskych dátach pracuje doc. Bednár. Z toho sa da vytiahnuť znalostný graf.
|
||||
- Na dátach zo vzdelávania pracuje vedúci - máme ZPWIKI.
|
||||
|
||||
|
||||
Nápady na prínos:
|
||||
|
||||
- navrhnite spôsob automatického budovania znalostného grafu vo zvolenej doméne.
|
||||
- navrhnite spôsob vyhľadávania s pomocou existujúceho znalostného grafu.
|
||||
- dotrénujte jazykový model alebo navrhnite metódu promptovania pre tvorbyu znalostných grafov z dát.
|
||||
- navrhnite metódu pre dotrénovanie jazykového modelu s pomocou znalostného grafu
|
||||
- augmentácia modelu s pomocou znalostného grafu.
|
||||
|
||||
|
||||
# Diplomový projekt 2026
|
||||
|
||||
Projekt odložený.
|
||||
|
||||
|
||||
Augmentácia dát pre zlepšenie získavania informácií
|
||||
|
||||
|
||||
|
||||
@ -30,9 +30,58 @@ Zadanie:
|
||||
Ciele:
|
||||
|
||||
|
||||
|
||||
Vytvorte databázu pre vyhľadávanie v právnych predpisoch s využitím grafovej informácie.
|
||||
|
||||
Stretnutie 26.5.2026
|
||||
|
||||
Stav:
|
||||
|
||||
- Agent aj parser funguje.
|
||||
- Webová aplikácia je nasadená cez streamlit.
|
||||
- grafová databáza neo4J cez neo4J aura.
|
||||
- najprv ide parsovanie štruktúry. V druhej etape ide sémantické parsovanie - langchain a llamaindex.
|
||||
- agent má viacero nástrojov.
|
||||
|
||||
```
|
||||
search_concept, # vyhľadávanie pojmov s provenienciou
|
||||
cypher_lookup, # fallback pre pokročilé Cypher dotazy
|
||||
fulltext_search, # fulltextové vyhľadávanie v texte paragrafov
|
||||
get_provision, # úplný text jedného paragrafu
|
||||
list_acts, # zoznam všetkých zákonov
|
||||
graph_traversal, # sémantické okolie konkrétneho zákona
|
||||
defines_concepts, # pojmy definované v zákone
|
||||
find_amendments, # novelizácie a zrušenia zákonov
|
||||
graph_stats, # štatistika grafu
|
||||
compare_acts, # porovnanie dvoch zákonov
|
||||
act_provisions, # štruktúra zákona (paragrafy, články atď.)
|
||||
```
|
||||
|
||||
Používa školský LLM model120-fast.
|
||||
|
||||
|
||||
|
||||
Stretnutie 6.3.
|
||||
|
||||
- Parser vie rozparsovať zákony na paragrafy a odseky, vie verzie zákonov.
|
||||
- Máme jednoduchého agenta, ktorý vie pracovať s grafovou databázou.
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Pripravte vzorovú datababázy zákonov - nemusia byť všetky a vložte ju do grafovej databázy..
|
||||
- Pripravte viacero testovacích scenárov pre vyhľadávanie v zákonoch. Scenár by mal byť vo forme otázky.
|
||||
- Agent by mal podľa otázky vyhľadať relevatné a súvisiace paragrafy v databáze a vygenerovať odpoveď podľa paragrafov.
|
||||
- Zobrazte aj zoznam zdrojov - relevantnej časti znalostného grafu.
|
||||
- Kódy dajte na GIT. Mal by tam byť parser. Aj agent. Aj stručná dokumentácia.
|
||||
- Pracujte na teoretickej časti práce. Napíšte o metódach GraphRAG. Používajte články z Google Scholar. Opíšte metódu zostavenia znalostného grafu, grafovú databázu aj architektúru agenta. Opíšte výsledky experimentov v testovacích scenároch.
|
||||
|
||||
|
||||
Zásobník úloh:
|
||||
|
||||
- Pripravte pekné webové rozhranie.
|
||||
- Pripravte deployment Vašej aplikácie - dockerfile a docker compose.
|
||||
|
||||
|
||||
|
||||
|
||||
Stretnutie 4.2.
|
||||
|
||||
|
||||
@ -36,7 +36,25 @@ Spolupráca:
|
||||
|
||||
- Projekt [Právne informácie](/topics/legal).
|
||||
|
||||
Stretnutie 19.12.
|
||||
|
||||
Stretnutie 23.3.2026
|
||||
|
||||
|
||||
Stav:
|
||||
|
||||
- Agent funguje.
|
||||
- Text je v príprave.
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Pracujte na texte práce. Používajte google scholar a odkazy v texte.
|
||||
- Rozšírte rozhranie pre prácu s verejným API.
|
||||
- Vytvorte MCP server pre prácu s verejným API.
|
||||
- Pripravte kódy na nasadenie pomocou Docker. Upravte konfiguráciu aby sa aplikácia dala používať s rôznymi modelmi cez OpenAI API. Môžete použiť LiteLLM.
|
||||
- Do práce opíšte rôzne scenáre použitia. Porovnajte aj viac jazykových modelov. Ako vedia iné jazykovvé modely spolupracovať s OpenAI Agents SDK?
|
||||
|
||||
|
||||
Stretnutie 19.12.2025
|
||||
|
||||
Stav:
|
||||
|
||||
|
||||
@ -22,6 +22,8 @@ Téma:
|
||||
Skórovací online systém pre robotické súťaže
|
||||
|
||||
|
||||
https://git.kemt.fei.tuke.sk/rz409st/scoring-system/src/branch/main/backend
|
||||
|
||||
Ciele:
|
||||
|
||||
- Vypracujte prehľad robotických súťaží a podporného softvéru pre robotické súťaže.
|
||||
|
||||
@ -37,6 +37,27 @@ https://github.com/RostikRd/bp2026
|
||||
- Pozrite si opatrenia na https://podporneopatrenia.minedu.sk/katalog-podpornych-opatreni/ a vyberte relevantné dokumenty
|
||||
- Vytvorte inteligentného agenta, ktorý by na základe dokumentov navrhol najlepšie výchovné opatrenia.
|
||||
|
||||
Stretnutie 11.5.
|
||||
|
||||
Stav:
|
||||
|
||||
- Dokončené texty aj program.
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Daje zdrojáky na GIT.
|
||||
|
||||
Stretnutie 6.3.
|
||||
|
||||
Stav:
|
||||
|
||||
- Prezentovaná teoretická časť
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Pokračujte v písaní.
|
||||
- Dajte zdrojáky na GIT.
|
||||
|
||||
Stretnutie 6.2.2026
|
||||
|
||||
Stav:
|
||||
|
||||
@ -24,6 +24,33 @@ Zadanie:
|
||||
3. Pomocou crawlera získajte dáta z internetu a vytvorte korpus dát pre viaceré domény.
|
||||
4. Analyzujte získané dáta, priebeh ich sťahovania a navrhnite zlepšenia procesu získavania textových dát.
|
||||
|
||||
Stretnutie 11.5.2026.
|
||||
|
||||
Stav:
|
||||
|
||||
- Napísaná práca
|
||||
- zozbierané texty
|
||||
|
||||
Úlohy:
|
||||
|
||||
- dokončite prácu
|
||||
- dajte zdrojáky na GIT.
|
||||
|
||||
|
||||
Stretnutie 13.3.2026
|
||||
|
||||
Stav:
|
||||
|
||||
- Zozbieraných cca 450MB textu.
|
||||
- Vylepšený text BP
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Pridajte funciu "dolovania" domén zo získaného textu.
|
||||
- Dajte kódy na GIT
|
||||
- Pokračujte v dolovaní textu, min. 5GB
|
||||
- zlepšite deduplikáciu a boilereplate removal - napr. justext.
|
||||
|
||||
Stretnutie 4.2.2025
|
||||
|
||||
Stav:
|
||||
@ -39,7 +66,6 @@ Stav:
|
||||
|
||||
|
||||
|
||||
|
||||
Stretnutie 18.12.2025
|
||||
|
||||
Stav:
|
||||
|
||||
Loading…
Reference in New Issue
Block a user