--- title: Maksym Zatirka published: true taxonomy: category: [bp2026] tag: [nlp,graph,db] author: Daniel Hladek --- rok začiatku štúdia: 2023 študent KM # Bakalárska práca 2026 Téma: Grafová databáza pre podporu generovania slovenského jazyka Ciele: Vytvorte databázu pre vyhľadávanie v rozsudkoch s využitím grafovej informácie. Stretnutie 2.10. Úlohy: - Prejdite si tutoriál https://python.langchain.com/docs/tutorials/rag/ - Prejdite si tutoriály https://neo4j.com/docs/getting-started/appendix/tutorials/tutorials-overview/ - Zistite, ako vieme využiť grafy pri RAG - ako skombinovať langchain a neo4j - Pokračujte v štúdiu Python - Prečítajte si články https://arxiv.org/abs/2408.08921 a https://ieeexplore.ieee.org/abstract/document/10771030 a robte si poznámky. Zásobník úloh: - Pripravte databázu znalosti zo súdnej domény pre zlepšenie vyhľadávania v rozsudkoch. Predbežné úlohy: - Naučte sa Python lepšie. Nainštalujte si prostredie Anaconda. - Poučte sa o strojovom účení. Dive into deep learning. - Zistite čo je to Retrieval Augmented Generation a napíšte si o tom poznámky - Pozrite si knižnicu [llamaindex](https://developers.llamaindex.ai/python/framework/). - Zistite čo je to [znalostný graf](https://en.wikipedia.org/wiki/Knowledge_graph) - Zistite ako funguje databáza Neo4J. - Zistite čo je to SparkQL. - Napíšte si poznámky z vecí ktoré ste sa naučili. Využívajte odborné články, ktoré nájdete na google scholar.