forked from KEMT/zpwiki
		
	Merge branch 'master' of git.kemt.fei.tuke.sk:KEMT/zpwiki
This commit is contained in:
		
						commit
						77076f47b7
					
				| @ -29,6 +29,20 @@ Zadanie: | |||||||
| 3. Navrhnite a vykonajte experimenty pre vyhodnotenie dotrénovaného modelu. | 3. Navrhnite a vykonajte experimenty pre vyhodnotenie dotrénovaného modelu. | ||||||
| 4. Vyhodnotťte experimenty a navrhnite zlepšenia.  | 4. Vyhodnotťte experimenty a navrhnite zlepšenia.  | ||||||
| 
 | 
 | ||||||
|  | Stretnutie 13.2.2025 | ||||||
|  | 
 | ||||||
|  | Stav: | ||||||
|  | 
 | ||||||
|  | - Napísaná teória - neviem? | ||||||
|  | - Práca na trénovaní mbert pomocou MS MARCO na úlohe extraktívnej QA čo nesedí so zadaním. | ||||||
|  | - Fuzzy matching na vyhľadanie odpovede v datasete. | ||||||
|  | 
 | ||||||
|  | Úlohy: | ||||||
|  | 
 | ||||||
|  | - Pokračujte v otvorených úlohách týkajúcich sa SBERT, pracujte na texte DP. | ||||||
|  | - Pozrite si a vyskúšajte repozitár https://github.com/hladek/slovak-retrieval, skript train-bi-mnlr.py. Upravte skript pre trénovnaie na MS MARCO. Natrénujte a vyhodnotte viac modelov. | ||||||
|  | - Naštudujte si metódy vyodnotenia vektorových modelov (MTEB a beir). Vyskúšajte skripty pre vyhodnotenie v danom repozitári (MTEB a BEIR). | ||||||
|  | - Skripty dajte na KEMT GIT. | ||||||
| 
 | 
 | ||||||
| Stretnutie 29.10.2024 | Stretnutie 29.10.2024 | ||||||
| 
 | 
 | ||||||
| @ -41,7 +55,7 @@ Stav: | |||||||
| 
 | 
 | ||||||
| - Podrobne si naštudujte a vyskúšajte framework Sentence Transformers https://sbert.net/index.html. Využite Google Colab na príklady. | - Podrobne si naštudujte a vyskúšajte framework Sentence Transformers https://sbert.net/index.html. Využite Google Colab na príklady. | ||||||
| - Podrobne si naštudujte databázu MS MARCO. Zistite a vyskúšajte dotrénovanie anglického modelu typu BERT (bert, roberta, xlm, deberta ...) na databáze MS Marco. | - Podrobne si naštudujte databázu MS MARCO. Zistite a vyskúšajte dotrénovanie anglického modelu typu BERT (bert, roberta, xlm, deberta ...) na databáze MS Marco. | ||||||
| - Píšte si poznámky o tom čo ste zistili o SBERT. Použite odkazy na vedecké články. Vedecké článkuý nájdete na Google Scholar. | - Píšte si poznámky o tom čo ste zistili o SBERT. Použite odkazy na vedecké články. Vedecké články nájdete na Google Scholar. | ||||||
| 
 | 
 | ||||||
| Zásobník úloh: | Zásobník úloh: | ||||||
| 
 | 
 | ||||||
|  | |||||||
| @ -36,6 +36,32 @@ Vyhľadávanie právnych informácií pomocou neurónových sietí | |||||||
| 
 | 
 | ||||||
| RAG: Generovanie jazyka s pomocou vyhľadávania - Retrieval augmented generation | RAG: Generovanie jazyka s pomocou vyhľadávania - Retrieval augmented generation | ||||||
| 
 | 
 | ||||||
|  | 13.2.2025 | ||||||
|  | 
 | ||||||
|  | Stav: | ||||||
|  | 
 | ||||||
|  | - Funguje QA nad databázou liekov. | ||||||
|  | - Autentifikacia cez Google. | ||||||
|  | - História sa ukladá do Postgres DB  na AWS. | ||||||
|  | - Používa sa Mistral Large. Slovenský Mistral nefunguje lebo ho treba dotrénovať.  | ||||||
|  | - Vektorový model paraphrase-multilingual-MiniLM-L12-v2 | ||||||
|  | - Projekt beží cez Docker, sú hotové aj Docker skripty. | ||||||
|  | - V texte je osnova a draft. Treba ešte pracovať hlavne na teoretickej časti - odbornej literatúre. | ||||||
|  | 
 | ||||||
|  | Úlohy: | ||||||
|  | 
 | ||||||
|  | - Pokračujte v práci na texte. | ||||||
|  | - Skúste vyhodnotiť navrhnutý systém. Pripravte dotazník. Osloviť kolegov aby to vyskúšali a slovne vyhodnotili systém. | ||||||
|  | - dajte nové kódy na git. | ||||||
|  | 
 | ||||||
|  | Zásobník úloh: | ||||||
|  | 
 | ||||||
|  | - Zlepšite logiku dialógu. Jazykový model by sa mal správať ak inteligentný agent - mal by mať definovaný cieľ konverzácie.  | ||||||
|  | - Definujte ciele dialógu - čo by mal agent vedieť pre úspešnú odpoveď. Napr. Interakcie s liekmi. Sú lieky na predpis? Aké sú podrobnejšie symptómy choroby? Suchý kašeľ alebo vykašliavanie? Koľko rokov má pacient? Aká anamnéza je dôležitá. | ||||||
|  | - Preštudujte si metodiku REACT a Chain of Thought. https://arxiv.org/abs/2210.03629   | ||||||
|  | 
 | ||||||
|  | 
 | ||||||
|  | 
 | ||||||
| 8.11.2024 | 8.11.2024 | ||||||
| 
 | 
 | ||||||
| Stav: | Stav: | ||||||
|  | |||||||
		Loading…
	
		Reference in New Issue
	
	Block a user