forked from KEMT/zpwiki
		
	z
This commit is contained in:
		
							parent
							
								
									888f08f7ea
								
							
						
					
					
						commit
						8d03d79a43
					
				
							
								
								
									
										62
									
								
								pages/students/2018/adrian_remias/README.md
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										62
									
								
								pages/students/2018/adrian_remias/README.md
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,62 @@ | |||||||
|  | --- | ||||||
|  | title: Adrián Remiáš | ||||||
|  | published: true | ||||||
|  | date: 01-02-2014 | ||||||
|  | taxonomy: | ||||||
|  |     category: [dp2024] | ||||||
|  |     tag: [nlp, transformers, interpuction] | ||||||
|  |     author: Daniel Hladek | ||||||
|  | --- | ||||||
|  | # Adrián Remiáš | ||||||
|  | 
 | ||||||
|  | Rok začiatku štúdia: 2018 | ||||||
|  | 
 | ||||||
|  | # Diplomová práca 2024 | ||||||
|  | 
 | ||||||
|  | Návrh na zadamie: | ||||||
|  | 
 | ||||||
|  | - Vypracujte prehľad metód obnovy interpunkcie v slovenskom jazyku | ||||||
|  | - Vypracujte prehľad metód jazykového modelovania pomocou neurónovej siete typu Transformer | ||||||
|  | - Pripravte dátovú množinu pre trénovanie a vyhodnotneie  neurónovej siete na úlohu dopĺňania a opravy interpunkcie. | ||||||
|  | - Vyberte viacero neurónových modelov, natrénujte ich na úlohu dopňlňania a opravy interpunkcie | ||||||
|  | - Vyhodnotte experimenty a vyberte najlepší model.  | ||||||
|  | 
 | ||||||
|  | 
 | ||||||
|  | Ciele: | ||||||
|  | 
 | ||||||
|  | - Natrénovanie modelu pre opravu iterpunkcie a jeho vyhodnotenie. | ||||||
|  | - Výsledky by mali byť prezentovateľné vo vedeckom článku. | ||||||
|  | 
 | ||||||
|  | 
 | ||||||
|  | Stretnutie 5.10.2023 | ||||||
|  | 
 | ||||||
|  | Stav: | ||||||
|  | 
 | ||||||
|  | - Urobená bakalárska práca na tému "Analýza textu z pohľadu forenznej lingvistiky". | ||||||
|  | 
 | ||||||
|  | 
 | ||||||
|  | Úlohy: | ||||||
|  | 
 | ||||||
|  | -  Nainštalujte si balíček Anaconda. Pomocou neho si nainštalujete knižnicu Pytorch s podporou CUDA. | ||||||
|  | 
 | ||||||
|  |      | ||||||
|  |         conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia | ||||||
|  |         pip install transformers | ||||||
|  | 
 | ||||||
|  | - Oboznámte sa s frameworkom HuggingFace [Transformers](https://huggingface.co/docs/transformers/index). Vypracujte si viacero úvodných tutoriálov. | ||||||
|  | - Podrobne sa oboznámte s úlohou [token classificaton](https://huggingface.co/docs/transformers/tasks/token_classification). | ||||||
|  | - Prečítajte si [článok](https://ieeexplore.ieee.org/abstract/document/9089903 Comparison of Recurrent Neural Networks for Slovak Punctuation Restoration, urobte si poznámky. | ||||||
|  | - Prečítajte si "Attention is all you need" https://arxiv.org/abs/1706.03762, urobte si poznámky. | ||||||
|  | - Vyhľadajte heslo "punctuation restoration" na google scholar, poznačte si najdôležitejšie články. Prečítajte si ich a napíšte, akú metódu používaju. | ||||||
|  | 
 | ||||||
|  | Zásobník úloh: | ||||||
|  | 
 | ||||||
|  | - Vyberte množinu slovenských textov a upravte ju do podoby  vhodnej na trénovanie neurónovej siete. Natrénujte neurónovú sieť. | ||||||
|  | - Na katedrovom gite si vytvorte repozitár s názvom DP2024, do neho dajte kódy pre tvorbu dát a trénovanie siete. Dáta nedávajte na git. | ||||||
|  | 
 | ||||||
|  | 
 | ||||||
|  | 
 | ||||||
|  | 
 | ||||||
|  | 
 | ||||||
|  | 
 | ||||||
|  | 
 | ||||||
		Loading…
	
		Reference in New Issue
	
	Block a user