forked from KEMT/zpwiki
		
	Update 'pages/students/2018/adrian_remias/README.md'
This commit is contained in:
		
							parent
							
								
									b79f78cc8e
								
							
						
					
					
						commit
						eb4f8def32
					
				| @ -34,8 +34,37 @@ Stretnutie 7.12.2023 | ||||
| Stav: | ||||
| 
 | ||||
| - Vytvorený program na trénovanie neurónovej siete. Masked language modeling  skript run_mlm.py. Roberta for Masked LM  DataCollatorForLanguageModelling. | ||||
| - Navrhnutý skript pridáva mask token medzi slová a sleduje, čo doplní model. Časť s trénovaním je v tomto prípade zbytočná.  | ||||
| 
 | ||||
| Úlohy: | ||||
| 
 | ||||
| - Vyhoddnotte prenosť Vami navrhnutého prístupu. Mali by ste zostaviť kontingenčnú tabuľku. (confusion matrix). Tabuľka má na jednej osi očakávané hodnoty a na druhej osi skutočné hodnoty. https://www.analyticsvidhya.com/blog/2020/09/precision-recall-machine-learning/ | ||||
| - O spôsobe vyhodnotenia môžete napísať aj krátku podkapitolu. | ||||
| - Uvedte zdroje odkiaľ ste čerpali pri tvorbe. | ||||
| 
 | ||||
| ``` | ||||
|   Pôvodný text:   Dnes   je  pekný  deň . | ||||
|   Opravený text   Dnes , je  pekný  deň . | ||||
| 
 | ||||
|       . , ? ! x  toto dáva sieť | ||||
|     . 2 1 0 0 0  | ||||
|     ,  | ||||
|     ? | ||||
|     ! | ||||
|     x   1     1 | ||||
|     očakávané hodnoty | ||||
| ``` | ||||
| 
 | ||||
| Zásobník úloh: | ||||
| 
 | ||||
| - Dotrénujte neurónovú sieť na úlohu dopňlňania interpunkcie. Úloha je formulovaná ako "klasifikácia postupností" a je podobná úlohám "part of speech tagging" alebo "named entity recognition". | ||||
| 
 | ||||
| Takto by mala vyzerať trénovacia množina. | ||||
| 
 | ||||
| ``` | ||||
| x     x    x    .        ,  x     x     . | ||||
| Dnes je pekný den Povedala že ostane doma | ||||
| ```  | ||||
| 
 | ||||
| Stretnutie 23.11.2023 | ||||
| 
 | ||||
| @ -46,7 +75,7 @@ Stav: | ||||
| 
 | ||||
| Úlohy: | ||||
| 
 | ||||
| - Podrobne sa oboznámte https://github.com/xashru/punctuation-restoration/tree/master . Prečítajte si | ||||
| - [ ] Podrobne sa oboznámte https://github.com/xashru/punctuation-restoration/tree/master . Prečítajte si | ||||
|  článok. Urobte si poznámky čo ste sa dozvedeli. Zistite, aké metódy iné sa používajú na PR a aká metóda je v článku. Zistitie, ako to súvisí s Modelom BERT. | ||||
|  - Pohľadajte iný podobný repozitár. | ||||
|  - Získajte zdrojové kódy a spustite experimenty v naglickom a bangla jazyku s dátami dodanými v repozitári. Oboznámte sa so zdrojovými kódmi a skúste pochopiť ktorá časť robí čo.  | ||||
|  | ||||
		Loading…
	
		Reference in New Issue
	
	Block a user