forked from KEMT/zpwiki
		
	z
This commit is contained in:
		
							parent
							
								
									888f08f7ea
								
							
						
					
					
						commit
						8d03d79a43
					
				
							
								
								
									
										62
									
								
								pages/students/2018/adrian_remias/README.md
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										62
									
								
								pages/students/2018/adrian_remias/README.md
									
									
									
									
									
										Normal file
									
								
							@ -0,0 +1,62 @@
 | 
			
		||||
---
 | 
			
		||||
title: Adrián Remiáš
 | 
			
		||||
published: true
 | 
			
		||||
date: 01-02-2014
 | 
			
		||||
taxonomy:
 | 
			
		||||
    category: [dp2024]
 | 
			
		||||
    tag: [nlp, transformers, interpuction]
 | 
			
		||||
    author: Daniel Hladek
 | 
			
		||||
---
 | 
			
		||||
# Adrián Remiáš
 | 
			
		||||
 | 
			
		||||
Rok začiatku štúdia: 2018
 | 
			
		||||
 | 
			
		||||
# Diplomová práca 2024
 | 
			
		||||
 | 
			
		||||
Návrh na zadamie:
 | 
			
		||||
 | 
			
		||||
- Vypracujte prehľad metód obnovy interpunkcie v slovenskom jazyku
 | 
			
		||||
- Vypracujte prehľad metód jazykového modelovania pomocou neurónovej siete typu Transformer
 | 
			
		||||
- Pripravte dátovú množinu pre trénovanie a vyhodnotneie  neurónovej siete na úlohu dopĺňania a opravy interpunkcie.
 | 
			
		||||
- Vyberte viacero neurónových modelov, natrénujte ich na úlohu dopňlňania a opravy interpunkcie
 | 
			
		||||
- Vyhodnotte experimenty a vyberte najlepší model. 
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
Ciele:
 | 
			
		||||
 | 
			
		||||
- Natrénovanie modelu pre opravu iterpunkcie a jeho vyhodnotenie.
 | 
			
		||||
- Výsledky by mali byť prezentovateľné vo vedeckom článku.
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
Stretnutie 5.10.2023
 | 
			
		||||
 | 
			
		||||
Stav:
 | 
			
		||||
 | 
			
		||||
- Urobená bakalárska práca na tému "Analýza textu z pohľadu forenznej lingvistiky".
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
Úlohy:
 | 
			
		||||
 | 
			
		||||
-  Nainštalujte si balíček Anaconda. Pomocou neho si nainštalujete knižnicu Pytorch s podporou CUDA.
 | 
			
		||||
 | 
			
		||||
    
 | 
			
		||||
        conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia
 | 
			
		||||
        pip install transformers
 | 
			
		||||
 | 
			
		||||
- Oboznámte sa s frameworkom HuggingFace [Transformers](https://huggingface.co/docs/transformers/index). Vypracujte si viacero úvodných tutoriálov.
 | 
			
		||||
- Podrobne sa oboznámte s úlohou [token classificaton](https://huggingface.co/docs/transformers/tasks/token_classification).
 | 
			
		||||
- Prečítajte si [článok](https://ieeexplore.ieee.org/abstract/document/9089903 Comparison of Recurrent Neural Networks for Slovak Punctuation Restoration, urobte si poznámky.
 | 
			
		||||
- Prečítajte si "Attention is all you need" https://arxiv.org/abs/1706.03762, urobte si poznámky.
 | 
			
		||||
- Vyhľadajte heslo "punctuation restoration" na google scholar, poznačte si najdôležitejšie články. Prečítajte si ich a napíšte, akú metódu používaju.
 | 
			
		||||
 | 
			
		||||
Zásobník úloh:
 | 
			
		||||
 | 
			
		||||
- Vyberte množinu slovenských textov a upravte ju do podoby  vhodnej na trénovanie neurónovej siete. Natrénujte neurónovú sieť.
 | 
			
		||||
- Na katedrovom gite si vytvorte repozitár s názvom DP2024, do neho dajte kódy pre tvorbu dát a trénovanie siete. Dáta nedávajte na git.
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
		Loading…
	
		Reference in New Issue
	
	Block a user