Compare commits

..

No commits in common. "ebda7b4a06b0fe965ad1257c0c025d427995cbef" and "186a7b8cea78b8ae1c378882c676b0609c1f4daa" have entirely different histories.

2 changed files with 0 additions and 66 deletions

View File

@ -25,23 +25,8 @@ Ciele:
Vytvorte databázu pre vyhľadávanie v rozsudkoch s využitím grafovej informácie. Vytvorte databázu pre vyhľadávanie v rozsudkoch s využitím grafovej informácie.
Stretnutie 2.10.
Úlohy: Úlohy:
- Prejdite si tutoriál https://python.langchain.com/docs/tutorials/rag/
- Prejdite si tutoriály https://neo4j.com/docs/getting-started/appendix/tutorials/tutorials-overview/
- Zistite, ako vieme využiť grafy pri RAG - ako skombinovať langchain a neo4j
- Pokračujte v štúdiu Python
- Prečítajte si články https://arxiv.org/abs/2408.08921 a https://ieeexplore.ieee.org/abstract/document/10771030 a robte si poznámky.
Zásobník úloh:
- Pripravte databázu znalosti zo súdnej domény pre zlepšenie vyhľadávania v rozsudkoch.
Predbežné úlohy:
- Naučte sa Python lepšie. Nainštalujte si prostredie Anaconda. - Naučte sa Python lepšie. Nainštalujte si prostredie Anaconda.
- Poučte sa o strojovom účení. Dive into deep learning. - Poučte sa o strojovom účení. Dive into deep learning.
- Zistite čo je to Retrieval Augmented Generation a napíšte si o tom poznámky - Zistite čo je to Retrieval Augmented Generation a napíšte si o tom poznámky

View File

@ -1,51 +0,0 @@
---
title: Legal Data Processing
category: [project]
tag: [legal,nlp]
---
# Legal Data Processing Scientific Project
Goal:
- Help the slovak judges
Possible applications:
- agent retrieval agent to search in laws and processdings.
- question answering system
Plan:
- Develop a demo agent for legal and proceeding retrieval anad answering.
- Develop a summarization system - retrieve and highlight important parts of document. Generate a summary.
People:
- Daniel Hládek
- Martin Šarišský
- Matej Ščišľak
- Maxim Zatyrka
- Oleksandr Dorybohov
Tasks:
- Create index of Slovak laws
- Create index of the Slovak Court proceedings.
- Fine-tune Slovak embedding model for the legal domain.
- Evaluate LLMS for the legal domain.
- Design legal data pre-processing (anonymization, de-anonymization)
- Create a knowledge graph (tezaurus)
- Create legal data summarization (extractive and abstractive) system.
- Create agent that utilizes OpenAPI
Links:
- OpenAPI pre prístup k údajom o súdoch a o rozsudkoch. https://obcan.justice.sk/pilot/api/ress-isu-service/swagger-ui/index.html
- https://www.justice.gov.sk/sluzby/register-partnerov-verejneho-sektora/open-data/
- https://rpvs.gov.sk/opendatav2/swagger/index.html
- Databáza zákonov a register opatrení https://static.slov-lex.sk/
- Tezaurus slovenského práva https://www.slov-lex.sk/tezaury/terminy - aj vzťahy ku právnym predpisom
- Znalostný graf údajov verejnej správy https://znalosti.gov.sk/