forked from KEMT/zpwiki
		
	Update 'pages/students/2018/adrian_remias/README.md'
This commit is contained in:
		
							parent
							
								
									b79f78cc8e
								
							
						
					
					
						commit
						eb4f8def32
					
				@ -34,8 +34,37 @@ Stretnutie 7.12.2023
 | 
				
			|||||||
Stav:
 | 
					Stav:
 | 
				
			||||||
 | 
					
 | 
				
			||||||
- Vytvorený program na trénovanie neurónovej siete. Masked language modeling  skript run_mlm.py. Roberta for Masked LM  DataCollatorForLanguageModelling.
 | 
					- Vytvorený program na trénovanie neurónovej siete. Masked language modeling  skript run_mlm.py. Roberta for Masked LM  DataCollatorForLanguageModelling.
 | 
				
			||||||
 | 
					- Navrhnutý skript pridáva mask token medzi slová a sleduje, čo doplní model. Časť s trénovaním je v tomto prípade zbytočná. 
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					Úlohy:
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					- Vyhoddnotte prenosť Vami navrhnutého prístupu. Mali by ste zostaviť kontingenčnú tabuľku. (confusion matrix). Tabuľka má na jednej osi očakávané hodnoty a na druhej osi skutočné hodnoty. https://www.analyticsvidhya.com/blog/2020/09/precision-recall-machine-learning/
 | 
				
			||||||
 | 
					- O spôsobe vyhodnotenia môžete napísať aj krátku podkapitolu.
 | 
				
			||||||
 | 
					- Uvedte zdroje odkiaľ ste čerpali pri tvorbe.
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					```
 | 
				
			||||||
 | 
					  Pôvodný text:   Dnes   je  pekný  deň .
 | 
				
			||||||
 | 
					  Opravený text   Dnes , je  pekný  deň .
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					      . , ? ! x  toto dáva sieť
 | 
				
			||||||
 | 
					    . 2 1 0 0 0 
 | 
				
			||||||
 | 
					    , 
 | 
				
			||||||
 | 
					    ?
 | 
				
			||||||
 | 
					    !
 | 
				
			||||||
 | 
					    x   1     1
 | 
				
			||||||
 | 
					    očakávané hodnoty
 | 
				
			||||||
 | 
					```
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					Zásobník úloh:
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					- Dotrénujte neurónovú sieť na úlohu dopňlňania interpunkcie. Úloha je formulovaná ako "klasifikácia postupností" a je podobná úlohám "part of speech tagging" alebo "named entity recognition".
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					Takto by mala vyzerať trénovacia množina.
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					```
 | 
				
			||||||
 | 
					x     x    x    .        ,  x     x     .
 | 
				
			||||||
 | 
					Dnes je pekný den Povedala že ostane doma
 | 
				
			||||||
 | 
					``` 
 | 
				
			||||||
 | 
					
 | 
				
			||||||
Stretnutie 23.11.2023
 | 
					Stretnutie 23.11.2023
 | 
				
			||||||
 | 
					
 | 
				
			||||||
@ -46,7 +75,7 @@ Stav:
 | 
				
			|||||||
 | 
					
 | 
				
			||||||
Úlohy:
 | 
					Úlohy:
 | 
				
			||||||
 | 
					
 | 
				
			||||||
- Podrobne sa oboznámte https://github.com/xashru/punctuation-restoration/tree/master . Prečítajte si
 | 
					- [ ] Podrobne sa oboznámte https://github.com/xashru/punctuation-restoration/tree/master . Prečítajte si
 | 
				
			||||||
 článok. Urobte si poznámky čo ste sa dozvedeli. Zistite, aké metódy iné sa používajú na PR a aká metóda je v článku. Zistitie, ako to súvisí s Modelom BERT.
 | 
					 článok. Urobte si poznámky čo ste sa dozvedeli. Zistite, aké metódy iné sa používajú na PR a aká metóda je v článku. Zistitie, ako to súvisí s Modelom BERT.
 | 
				
			||||||
 - Pohľadajte iný podobný repozitár.
 | 
					 - Pohľadajte iný podobný repozitár.
 | 
				
			||||||
 - Získajte zdrojové kódy a spustite experimenty v naglickom a bangla jazyku s dátami dodanými v repozitári. Oboznámte sa so zdrojovými kódmi a skúste pochopiť ktorá časť robí čo. 
 | 
					 - Získajte zdrojové kódy a spustite experimenty v naglickom a bangla jazyku s dátami dodanými v repozitári. Oboznámte sa so zdrojovými kódmi a skúste pochopiť ktorá časť robí čo. 
 | 
				
			||||||
 | 
				
			|||||||
		Loading…
	
		Reference in New Issue
	
	Block a user