forked from KEMT/zpwiki
		
	Update 'pages/students/2018/adrian_remias/README.md'
This commit is contained in:
		
							parent
							
								
									b79f78cc8e
								
							
						
					
					
						commit
						eb4f8def32
					
				| @ -34,8 +34,37 @@ Stretnutie 7.12.2023 | |||||||
| Stav: | Stav: | ||||||
| 
 | 
 | ||||||
| - Vytvorený program na trénovanie neurónovej siete. Masked language modeling  skript run_mlm.py. Roberta for Masked LM  DataCollatorForLanguageModelling. | - Vytvorený program na trénovanie neurónovej siete. Masked language modeling  skript run_mlm.py. Roberta for Masked LM  DataCollatorForLanguageModelling. | ||||||
|  | - Navrhnutý skript pridáva mask token medzi slová a sleduje, čo doplní model. Časť s trénovaním je v tomto prípade zbytočná.  | ||||||
| 
 | 
 | ||||||
|  | Úlohy: | ||||||
| 
 | 
 | ||||||
|  | - Vyhoddnotte prenosť Vami navrhnutého prístupu. Mali by ste zostaviť kontingenčnú tabuľku. (confusion matrix). Tabuľka má na jednej osi očakávané hodnoty a na druhej osi skutočné hodnoty. https://www.analyticsvidhya.com/blog/2020/09/precision-recall-machine-learning/ | ||||||
|  | - O spôsobe vyhodnotenia môžete napísať aj krátku podkapitolu. | ||||||
|  | - Uvedte zdroje odkiaľ ste čerpali pri tvorbe. | ||||||
|  | 
 | ||||||
|  | ``` | ||||||
|  |   Pôvodný text:   Dnes   je  pekný  deň . | ||||||
|  |   Opravený text   Dnes , je  pekný  deň . | ||||||
|  | 
 | ||||||
|  |       . , ? ! x  toto dáva sieť | ||||||
|  |     . 2 1 0 0 0  | ||||||
|  |     ,  | ||||||
|  |     ? | ||||||
|  |     ! | ||||||
|  |     x   1     1 | ||||||
|  |     očakávané hodnoty | ||||||
|  | ``` | ||||||
|  | 
 | ||||||
|  | Zásobník úloh: | ||||||
|  | 
 | ||||||
|  | - Dotrénujte neurónovú sieť na úlohu dopňlňania interpunkcie. Úloha je formulovaná ako "klasifikácia postupností" a je podobná úlohám "part of speech tagging" alebo "named entity recognition". | ||||||
|  | 
 | ||||||
|  | Takto by mala vyzerať trénovacia množina. | ||||||
|  | 
 | ||||||
|  | ``` | ||||||
|  | x     x    x    .        ,  x     x     . | ||||||
|  | Dnes je pekný den Povedala že ostane doma | ||||||
|  | ```  | ||||||
| 
 | 
 | ||||||
| Stretnutie 23.11.2023 | Stretnutie 23.11.2023 | ||||||
| 
 | 
 | ||||||
| @ -46,7 +75,7 @@ Stav: | |||||||
| 
 | 
 | ||||||
| Úlohy: | Úlohy: | ||||||
| 
 | 
 | ||||||
| - Podrobne sa oboznámte https://github.com/xashru/punctuation-restoration/tree/master . Prečítajte si | - [ ] Podrobne sa oboznámte https://github.com/xashru/punctuation-restoration/tree/master . Prečítajte si | ||||||
|  článok. Urobte si poznámky čo ste sa dozvedeli. Zistite, aké metódy iné sa používajú na PR a aká metóda je v článku. Zistitie, ako to súvisí s Modelom BERT. |  článok. Urobte si poznámky čo ste sa dozvedeli. Zistite, aké metódy iné sa používajú na PR a aká metóda je v článku. Zistitie, ako to súvisí s Modelom BERT. | ||||||
|  - Pohľadajte iný podobný repozitár. |  - Pohľadajte iný podobný repozitár. | ||||||
|  - Získajte zdrojové kódy a spustite experimenty v naglickom a bangla jazyku s dátami dodanými v repozitári. Oboznámte sa so zdrojovými kódmi a skúste pochopiť ktorá časť robí čo.  |  - Získajte zdrojové kódy a spustite experimenty v naglickom a bangla jazyku s dátami dodanými v repozitári. Oboznámte sa so zdrojovými kódmi a skúste pochopiť ktorá časť robí čo.  | ||||||
|  | |||||||
		Loading…
	
		Reference in New Issue
	
	Block a user