forked from KEMT/zpwiki
		
	Update 'pages/students/2018/adrian_remias/README.md'
This commit is contained in:
		
							parent
							
								
									df53b4af35
								
							
						
					
					
						commit
						67f20bb84a
					
				@ -28,6 +28,20 @@ Ciele:
 | 
			
		||||
- Natrénovanie modelu pre opravu iterpunkcie a jeho vyhodnotenie.
 | 
			
		||||
- Výsledky by mali byť prezentovateľné vo vedeckom článku.
 | 
			
		||||
 | 
			
		||||
Stretnutie 3.1.2024
 | 
			
		||||
 | 
			
		||||
Stav:
 | 
			
		||||
 | 
			
		||||
. Funguje zero shot metóda založená na dopňĺňaní mask tokenu.
 | 
			
		||||
 | 
			
		||||
Úlohy:
 | 
			
		||||
 | 
			
		||||
1. Vyskúšajte príklad [token classification](https://github.com/huggingface/transformers/tree/main/examples/pytorch/token-classification) z repozitára HF transformers pre úlohu NER alebo POS.  Oboznámte sa s argumentami príkazového riadka.
 | 
			
		||||
2. Pripravte si trénovacie dáta. Použite formát JSON. Na jeden riadok ide jeden príklad. Príklad je tvorený textom (zoznamom slov) a interpunkciou (zoznam tried). Budete mať súbor train.json a test.json. Na prípravu dátovej množiny si pripravte skript aby to bolo opakovateľné.
 | 
			
		||||
3. Spustite skript so svojimi dátami a so slovenským BERTOMN. Nastavte parametre príkazového riadku a formát trénovacej množiny tak aby tomu skript rozumel. 
 | 
			
		||||
4. Vyskúšajte viaceré experimenty s viacerými rôznymi BERT modelmi s podporou slovenčiny a výžsledky zapíšte do tabuľky.
 | 
			
		||||
5. Skúste číselne vyhodnotiť aj Vašu "zero shot" metódu.
 | 
			
		||||
- Pokračujte v písaní tectu práce.
 | 
			
		||||
 | 
			
		||||
Stretnutie 7.12.2023
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
		Loading…
	
		Reference in New Issue
	
	Block a user