forked from KEMT/zpwiki
		
	Update 'pages/students/2020/pavol_hudak/README.md'
This commit is contained in:
		
							parent
							
								
									5a3033991b
								
							
						
					
					
						commit
						ea3cf0455b
					
				@ -19,18 +19,18 @@ Ciel:
 | 
				
			|||||||
Ciele na semester:
 | 
					Ciele na semester:
 | 
				
			||||||
 | 
					
 | 
				
			||||||
- Zobrať veľký jazykový model (základný alebo instruct alebo chat). 
 | 
					- Zobrať veľký jazykový model (základný alebo instruct alebo chat). 
 | 
				
			||||||
- Skúsiť ho dotrénovať metódou PEFT pre úlohu Question Answering na korpuse SK QUAD.
 | 
					- Skúsiť ho dotrénovať metódou PEFT pre úlohu Question Answering na korpuse SK QUAD. Vieme sa inšpirovať výsledkami E. Matovka.
 | 
				
			||||||
 | 
					- Strojovo preložiť vybranú databázu otázok a odpovedí a pomocou nej skúsiť vylepšiť model.
 | 
				
			||||||
- Vyhodnotiť presnosť QA dotrénovaného modelu.
 | 
					- Vyhodnotiť presnosť QA dotrénovaného modelu.
 | 
				
			||||||
 | 
					
 | 
				
			||||||
Ďalšie nápady:
 | 
					Ďalšie nápady:
 | 
				
			||||||
 | 
					
 | 
				
			||||||
- 
 | 
					- Automaticky zlepšiť "prompt" pre QA.
 | 
				
			||||||
 | 
					
 | 
				
			||||||
Vybrať jednu z úloh:
 | 
					Vybrať jednu z úloh:
 | 
				
			||||||
 | 
					
 | 
				
			||||||
- Tvorba instruct datasetu - Anotácia alebo preklad množín
 | 
					- Tvorba instruct datasetu - Anotácia alebo preklad množín
 | 
				
			||||||
- Dotrénovanie LLM na dostupnom hardvéri - LORA-PEFT
 | 
					- Dotrénovanie LLM na dostupnom hardvéri - LORA-PEFT
 | 
				
			||||||
- Rozpoznávanie nenávistnej reči (pomocou LLM?, prompting, finetuning)
 | 
					 | 
				
			||||||
 | 
					
 | 
				
			||||||
Stretnutie 5.4.
 | 
					Stretnutie 5.4.
 | 
				
			||||||
 | 
					
 | 
				
			||||||
@ -38,6 +38,14 @@ Stav:
 | 
				
			|||||||
 | 
					
 | 
				
			||||||
- Nainštalované PrivateGPT. 
 | 
					- Nainštalované PrivateGPT. 
 | 
				
			||||||
- Nainštalovaná Anaconda a Python, aj štúdium a príprava.
 | 
					- Nainštalovaná Anaconda a Python, aj štúdium a príprava.
 | 
				
			||||||
 | 
					- Oboznámenie sa s LangChain a SlovakAlpaca aj PEFT.
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					Úlohy:
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					- Skúste dotrénovať veľký jazykový model metódou PEFT s množinou SlovakAlpaca. Vyberte vhodný model.
 | 
				
			||||||
 | 
					- Kandidáti sú UMT5, 
 | 
				
			||||||
 | 
					- Vyhodnoote presnosť dotrénovania (BLEU - založené na porovnávaní ngramov výsledku a očakávania). 
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					
 | 
				
			||||||
Stretnutie 23.2.
 | 
					Stretnutie 23.2.
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
				
			|||||||
		Loading…
	
		Reference in New Issue
	
	Block a user