forked from KEMT/zpwiki
		
	Update 'pages/students/2016/dominik_nagy/README.md'
This commit is contained in:
		
							parent
							
								
									9d961f88ef
								
							
						
					
					
						commit
						21b9c8ddc8
					
				@ -23,6 +23,28 @@ taxonomy:
 | 
				
			|||||||
3. Vyberte minimálne dva rôzne modely a porovnajte ich presnosť na vhodnej dátovej množine. 
 | 
					3. Vyberte minimálne dva rôzne modely a porovnajte ich presnosť na vhodnej dátovej množine. 
 | 
				
			||||||
4. Na základe výsledkov experimentov navrhnite zlepšenia.
 | 
					4. Na základe výsledkov experimentov navrhnite zlepšenia.
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					Stretnutie 17.12.2021
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					Stav:
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					- rozbehané trénovanie na slovensko-anglickom (LinDat) paralelnom korpuse.
 | 
				
			||||||
 | 
					- model z angličtiny do slovenčiny. 
 | 
				
			||||||
 | 
					- tokenizácia subword NMT.
 | 
				
			||||||
 | 
					- rozbehané trénovanie na GPU, bez anaconda.
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					Úlohy:
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					- Cieľ je aby Vaše experimenty boli zopakovateľné. Pridajte všetky trénovacie skripty do git repozitára. Nepridávajte dáta. Pridajte skripty alebo návody na to ako pripraviť dáta. 
 | 
				
			||||||
 | 
					- Zostavte tabuľku kde zapíšete parametre trénovania a dosiahnuté výsledky. 
 | 
				
			||||||
 | 
					- Napíšte prehľad aktuálnych metód strojového prekladu pomocou neurónových sietí kde prečítate viacero vedeckých článkov a  ku každému uvediete názov a čo ste sa z neho dozvedeli. Vyhľadávajte kľúčové slovíčka: "Survey of neural machine translation". Chceme sa dozvedieť aj o transformeroch a neurónových jazykových modeloch. 
 | 
				
			||||||
 | 
					- vyskúšajte trénovanie aj s inými architektúrami. Ku každému trénovaniu si poznačte skrupt, výsledky a dajte to na git. 
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					Zásobník úloh:
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					- Výskúšajte preklad v opačnom smere. 
 | 
				
			||||||
 | 
					- Vyskúšanie inej metódy tokenizácie (BPE, sentencepiece, wordpiece - huggingface tokenizers).
 | 
				
			||||||
 | 
					
 | 
				
			||||||
Stretnutie 6.7.2021
 | 
					Stretnutie 6.7.2021
 | 
				
			||||||
 | 
					
 | 
				
			||||||
Stav:
 | 
					Stav:
 | 
				
			||||||
@ -31,7 +53,7 @@ Stav:
 | 
				
			|||||||
 | 
					
 | 
				
			||||||
Úlohy:
 | 
					Úlohy:
 | 
				
			||||||
 | 
					
 | 
				
			||||||
- Pokračujte v trénovaní na servri IDOC, použite sakrupt na príápravu prostredia ktorý som Vám dal.
 | 
					- Pokračujte v trénovaní na servri IDOC, použite skript na príápravu prostredia ktorý som Vám dal.
 | 
				
			||||||
- Pripravte veľký slovensko-anglický paralelný korpus a natrénujte z neho model.
 | 
					- Pripravte veľký slovensko-anglický paralelný korpus a natrénujte z neho model.
 | 
				
			||||||
- Model vyhodnotťe pomocou metriky BLEU. Naštudujte si metriku BLEU. 
 | 
					- Model vyhodnotťe pomocou metriky BLEU. Naštudujte si metriku BLEU. 
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
				
			|||||||
		Loading…
	
		Reference in New Issue
	
	Block a user