forked from KEMT/zpwiki
		
	Smazat „pages/students/2016/patrik_pavlisin/tp20“
This commit is contained in:
		
							parent
							
								
									93620c8eaf
								
							
						
					
					
						commit
						3c5c855d45
					
				@ -1,33 +0,0 @@
 | 
				
			|||||||
# Štatistický strojový preklad
 | 
					 | 
				
			||||||
Strojový preklad je automatický preklad jednej, alebo skupiny viacerých viet jedného jazyka do druhého pomocou počítačov. 
 | 
					 | 
				
			||||||
Jedná sa o dôležitú aplikáciu v oblasti spracovania prirodzeného jazyka a záujem o toto odvetvie je takmer taký starý 
 | 
					 | 
				
			||||||
ako elektronický počítač. Štatistický strojový preklad zaznamenal za necelé dve desaťročia obrovský pokrok a v súčasnosti 
 | 
					 | 
				
			||||||
práve on dominuje v tejto oblasti výskumu. SMT využíva veľké množstvo paralelných korpusov a textov, ktoré už boli predtým 
 | 
					 | 
				
			||||||
ložené, vďaka čomu je stroj preložiť dovtedy nevidené vety. Príkladom pre SMT sú modely IBM, slovné modely, ktoré 
 | 
					 | 
				
			||||||
predstavujú prvú generáciu štatistického strojového prekladu. S použitím rôznych nástrojov a dostatku paralelného textu 
 | 
					 | 
				
			||||||
tak môžeme vytvoriť strojový preklad pre nový jazykový pár vo veľmi krátkom čase, podľa niektorých štúdii dokonca za 
 | 
					 | 
				
			||||||
menej ako deň.
 | 
					 | 
				
			||||||
 | 
					 | 
				
			||||||
Popularita internetu výrazne ovplyvnila záujem o strojový preklad a šírenie informácii vo viacerých jazykoch. 
 | 
					 | 
				
			||||||
Príkladom sú viacjazyčné vlády, spravodajské agentúry a spoločnosti pôsobiace na globálnom trhu. Vďaka tomuto 
 | 
					 | 
				
			||||||
rozšíreniu sú základným zdrojom vo výskume SMT, pretože sú každodenným produktom bežných ľudských činností. 
 | 
					 | 
				
			||||||
A je to taktiež jeden z dôvodov, prečo Európska únia, či Vláda Spojených štátov zvýšila financovanie výskumu 
 | 
					 | 
				
			||||||
strojového prekladu na podporu svojich záujmov v oblasti politiky. Rýchli a lacný výpočtový hardvér umožnil 
 | 
					 | 
				
			||||||
aplikácie, ktoré závisia od veľkého počtu súborov údajov a miliárd štatistík. Výrazne k tomu prispeli pokroky v 
 | 
					 | 
				
			||||||
rýchlosti procesora, veľkosti a rýchlosti pamäte novších počítačov. Vývoj metrík automatického prekladu taktiež 
 | 
					 | 
				
			||||||
umožnil zrýchliť vývoj systémov strojového prekladu a podporil konkurenciu medzi výskumnými skupinami. [10]
 | 
					 | 
				
			||||||
 | 
					 | 
				
			||||||
# Neurónový strojový preklad
 | 
					 | 
				
			||||||
Sila NMT spočíva v jeho schopnosti učiť sa priamo, end-to-end spôsobom, mapovanie zo vstupného textu na asociovaný 
 | 
					 | 
				
			||||||
výstupný text. Neurónový strojový preklad je jedným z novších prístupov k štatistickej strojovej translácii založenej 
 | 
					 | 
				
			||||||
čisto na neurónových sieťach, pozostávajú z kódovacieho zariadenia a dekódera. Tento typ strojového prekladu viedol k 
 | 
					 | 
				
			||||||
zlepšeniu najmä v oblasti hodnotenia ľudí, v porovnaní so systémami založenými na štatistických pravidlách a štatistickým 
 | 
					 | 
				
			||||||
strojovým prekladom. Posledné štúdie však ukazujú, že NMT všeobecne produkuje plynulé, ale nedostatočné preklady, čo je 
 | 
					 | 
				
			||||||
v kontraste s konvenčným štatistickým strojovým prekladom, ktorý produkuje adekvátne, ale nie plynulé preklady. 
 | 
					 | 
				
			||||||
Kóder extrahuje reprezentáciu pevnej dĺžky zo vstupnej vety s premennou dĺžkou a dekóder následne vygeneruje finálny 
 | 
					 | 
				
			||||||
preklad z danej reprezentácie. Neurálny strojový preklad funguje dobre predovšetkým na krátke vety bez neznámych 
 | 
					 | 
				
			||||||
slov, preklad sa však zhoršuje s pribúdajúcou dĺžkou textu a neznámych slov, taktiež slovná zásoba ma veľký vplyv 
 | 
					 | 
				
			||||||
na výkon prekladu. Výhodou neurálneho strojového prekladu je, že oproti SMT vyžaduje iba zlomok pamäte pre trénovanie 
 | 
					 | 
				
			||||||
(napr. ak neurónový strojový preklad použije 500 MB pamäte, SMT by na rovnaké trénovanie využil desiatky gigabajtov). 
 | 
					 | 
				
			||||||
Na rozdiel od iných konvenčných prekladových systémov, sa každý komponent modelu neurálneho prekladu trénuje 
 | 
					 | 
				
			||||||
spoločne, aby sa maximalizoval výkon prekladu. [4] [5] [6] [7]
 | 
					 | 
				
			||||||
		Loading…
	
		Reference in New Issue
	
	Block a user