Update pages/students/2021/martin_sarissky/README.md

This commit is contained in:
dano 2025-03-10 13:43:58 +00:00
parent 20cc4f586f
commit e9527b1e72

View File

@ -11,8 +11,12 @@ rok začiatku štúdia: 2021
# Diplomová praca 2026 # Diplomová praca 2026
Ciele: Ciele:
- Vytvoriť systém pre spracovanie právnych informácií. Systém by mal vedieť vyhľadávať v rozsudkoch, zákonoch a vyhláškac
, odpovedať na otázky a sumarizovať dokumenty. Je možné , že riešenie úlohy si vyžiada viac krokov.
- Vytvoriť sadu vzorových úloh pre vyhodnotenie takéhoto systému.
- Zlepšiť generovanie odpovedí pre úlohy vyžadujúce viac krokov. - Zlepšiť generovanie odpovedí pre úlohy vyžadujúce viac krokov.
Príprava: Príprava:
@ -28,6 +32,25 @@ Príprava:
Stretnutie 10.3.2025
Úlohy:
- Preštudovať - ako zostaviť RAG systém pomocou LangChain
- Zistiť ako fungujú agentové systémy na báze LLM - React. A volanie "nástrojov" function calling pomocou LLM.
- Vytvoriť RAG systém pre spracovanie tejto databázy. Pozrite si: Inšpirácia prácou Valerii Kutsenko, Yevhenii Leonov, [Oleh Poiasnik](/students/2022/oleh_poiasnik). Môžete sa inšpirovať [GIT BP Poiasnik](https://git.kemt.fei.tuke.sk/op405wm/Bakalarska_praca) (úloha Ščišľak)
- Vytvoriť databázu právnych informácií - texty zákonov, vyhlášok a rozsudkov spolu s metainformáciami. Vedúci pridelí prístup na QUADRO. (úloha Šarišský)
- Získajte prístup na QUADRO. V adresári /mnt/sharedhome/hladek/corpora/slovak_law/ sú dáta. Dáta premente do JSON.
Extrahujte text, vytiahnite metainformácie. Na extrakciu textu využite vhodnú knižnicu. Napr. Apache TIKA.
Zásobník úloh:
- Dáta sa vložia do databázy a zaindexujú vhodným SBERT modelom.
- Vyhľadať na internete množinu vzorových právnych otázok a vyhodnotiť systém (Šarišský)
# Bakalárska práca 2024 # Bakalárska práca 2024