forked from KEMT/zpwiki
		
	Update pages/students/2021/martin_sarissky/README.md
This commit is contained in:
		
							parent
							
								
									726d618b0e
								
							
						
					
					
						commit
						9449251026
					
				| @ -30,17 +30,31 @@ Príprava: | ||||
| - Zistite ako funguje dotrénovnaie veľkých jazykových modelov. Zistite čo je to PEFT (LORA, QLORA) a čo je to kvantizácia.  Zisite čo je to "few shot" prompting.   | ||||
| - Čo je to inferenčný server. Zistite čo je to VLLM, na čo je to dobré. Pozri si LocalAI. | ||||
| 
 | ||||
| ## Diplomový projekt 2025 | ||||
| 
 | ||||
| Stretnutie 14.5.2025 | ||||
| 
 | ||||
| Stav: | ||||
| 
 | ||||
| - Zaindexované zákony a vyhlášky vyhlásené v roku 2022 pomocou FAISS a SlovakBert-mnlr | ||||
| - Urobené gradio demo pomocou langchain, ktoré ku dotazu nájde a zobrazí 3 najlepšie dokumenty. | ||||
| 
 | ||||
| Úlohy: | ||||
| 
 | ||||
| - Zlepšite skript pre predspracovanie dát. Pridajte ďalšie dáta, identifikujte a opravte nedostatky. | ||||
| - Preštudujte si LangGraph. | ||||
| 
 | ||||
| 
 | ||||
| Stretnutie 10.3.2025 | ||||
| 
 | ||||
| Úlohy: | ||||
| 
 | ||||
| - Preštudovať - ako zostaviť RAG systém pomocou LangChain | ||||
| - Zistiť ako fungujú agentové systémy na báze LLM - React. A volanie "nástrojov" function calling pomocou LLM. | ||||
| - Vytvoriť RAG systém pre spracovanie tejto databázy. Pozrite si: Inšpirácia prácou Valerii Kutsenko, Yevhenii Leonov,  [Oleh Poiasnik](/students/2022/oleh_poiasnik). Môžete sa inšpirovať [GIT BP Poiasnik](https://git.kemt.fei.tuke.sk/op405wm/Bakalarska_praca) (úloha Ščišľak) | ||||
| - Vytvoriť databázu právnych informácií - texty zákonov, vyhlášok a rozsudkov spolu s metainformáciami. Vedúci pridelí prístup na QUADRO. (úloha Šarišský) | ||||
| - [x] Preštudovať - ako zostaviť RAG systém pomocou LangChain | ||||
| - [-] Vytvoriť databázu právnych informácií - texty zákonov, vyhlášok a rozsudkov spolu s metainformáciami. Vedúci pridelí prístup na QUADRO. (úloha Šarišský) | ||||
| - [-] Zistiť ako fungujú agentové systémy na báze LLM - React. A volanie "nástrojov" function calling pomocou LLM. | ||||
| - Získajte prístup na QUADRO. V adresári  /mnt/sharedhome/hladek/corpora/slovak_law/ sú dáta. Dáta premente do JSON. | ||||
| Extrahujte text, vytiahnite metainformácie. Na extrakciu textu využite vhodnú knižnicu. Napr. Apache TIKA. | ||||
| - [-] Vytvoriť RAG systém pre spracovanie tejto databázy. Pozrite si: Inšpirácia prácou Valerii Kutsenko, Yevhenii Leonov,  [Oleh Poiasnik](/students/2022/oleh_poiasnik). Môžete sa inšpirovať [GIT BP Poiasnik](https://git.kemt.fei.tuke.sk/op405wm/Bakalarska_praca) (úloha Ščišľak) | ||||
| 
 | ||||
| Myšlienkový postup pre ZP: | ||||
| 
 | ||||
| @ -51,8 +65,8 @@ Myšlienkový postup pre ZP: | ||||
| 
 | ||||
| Zásobník úloh: | ||||
| 
 | ||||
| - Dáta sa vložia do databázy a zaindexujú vhodným SBERT modelom. | ||||
| - Vyhľadať na internete množinu vzorových právnych otázok a vyhodnotiť systém (Šarišský) | ||||
| - [x] Dáta sa vložia do databázy a zaindexujú vhodným SBERT modelom. | ||||
| - [ ] Vyhľadať na internete množinu vzorových právnych otázok a vyhodnotiť systém (Šarišský) | ||||
| 
 | ||||
| 
 | ||||
| 
 | ||||
|  | ||||
		Loading…
	
		Reference in New Issue
	
	Block a user