Update pages/students/2021/martin_sarissky/README.md
This commit is contained in:
parent
726d618b0e
commit
9449251026
@ -30,17 +30,31 @@ Príprava:
|
||||
- Zistite ako funguje dotrénovnaie veľkých jazykových modelov. Zistite čo je to PEFT (LORA, QLORA) a čo je to kvantizácia. Zisite čo je to "few shot" prompting.
|
||||
- Čo je to inferenčný server. Zistite čo je to VLLM, na čo je to dobré. Pozri si LocalAI.
|
||||
|
||||
## Diplomový projekt 2025
|
||||
|
||||
Stretnutie 14.5.2025
|
||||
|
||||
Stav:
|
||||
|
||||
- Zaindexované zákony a vyhlášky vyhlásené v roku 2022 pomocou FAISS a SlovakBert-mnlr
|
||||
- Urobené gradio demo pomocou langchain, ktoré ku dotazu nájde a zobrazí 3 najlepšie dokumenty.
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Zlepšite skript pre predspracovanie dát. Pridajte ďalšie dáta, identifikujte a opravte nedostatky.
|
||||
- Preštudujte si LangGraph.
|
||||
|
||||
|
||||
Stretnutie 10.3.2025
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Preštudovať - ako zostaviť RAG systém pomocou LangChain
|
||||
- Zistiť ako fungujú agentové systémy na báze LLM - React. A volanie "nástrojov" function calling pomocou LLM.
|
||||
- Vytvoriť RAG systém pre spracovanie tejto databázy. Pozrite si: Inšpirácia prácou Valerii Kutsenko, Yevhenii Leonov, [Oleh Poiasnik](/students/2022/oleh_poiasnik). Môžete sa inšpirovať [GIT BP Poiasnik](https://git.kemt.fei.tuke.sk/op405wm/Bakalarska_praca) (úloha Ščišľak)
|
||||
- Vytvoriť databázu právnych informácií - texty zákonov, vyhlášok a rozsudkov spolu s metainformáciami. Vedúci pridelí prístup na QUADRO. (úloha Šarišský)
|
||||
- [x] Preštudovať - ako zostaviť RAG systém pomocou LangChain
|
||||
- [-] Vytvoriť databázu právnych informácií - texty zákonov, vyhlášok a rozsudkov spolu s metainformáciami. Vedúci pridelí prístup na QUADRO. (úloha Šarišský)
|
||||
- [-] Zistiť ako fungujú agentové systémy na báze LLM - React. A volanie "nástrojov" function calling pomocou LLM.
|
||||
- Získajte prístup na QUADRO. V adresári /mnt/sharedhome/hladek/corpora/slovak_law/ sú dáta. Dáta premente do JSON.
|
||||
Extrahujte text, vytiahnite metainformácie. Na extrakciu textu využite vhodnú knižnicu. Napr. Apache TIKA.
|
||||
- [-] Vytvoriť RAG systém pre spracovanie tejto databázy. Pozrite si: Inšpirácia prácou Valerii Kutsenko, Yevhenii Leonov, [Oleh Poiasnik](/students/2022/oleh_poiasnik). Môžete sa inšpirovať [GIT BP Poiasnik](https://git.kemt.fei.tuke.sk/op405wm/Bakalarska_praca) (úloha Ščišľak)
|
||||
|
||||
Myšlienkový postup pre ZP:
|
||||
|
||||
@ -51,8 +65,8 @@ Myšlienkový postup pre ZP:
|
||||
|
||||
Zásobník úloh:
|
||||
|
||||
- Dáta sa vložia do databázy a zaindexujú vhodným SBERT modelom.
|
||||
- Vyhľadať na internete množinu vzorových právnych otázok a vyhodnotiť systém (Šarišský)
|
||||
- [x] Dáta sa vložia do databázy a zaindexujú vhodným SBERT modelom.
|
||||
- [ ] Vyhľadať na internete množinu vzorových právnych otázok a vyhodnotiť systém (Šarišský)
|
||||
|
||||
|
||||
|
||||
|
Loading…
Reference in New Issue
Block a user