diff --git a/pages/students/2016/darius_lindvai/README.md b/pages/students/2016/darius_lindvai/README.md index 33ba579177..f33e58d469 100755 --- a/pages/students/2016/darius_lindvai/README.md +++ b/pages/students/2016/darius_lindvai/README.md @@ -6,3 +6,4 @@ Úlohy na vypracovanie: - [rešerš](./timovy_projekt/resers) tak na 3 strany - čo najnovšie sa píše na tému "puctuation restoration" - krátky program a [tutoriál](./timovy_projekt/tutorial) (program s rozsiahlym komentárom ) v Pythone na využitie LSTM + diff --git a/pages/students/2016/darius_lindvai/timovy_projekt/resers/README.md b/pages/students/2016/darius_lindvai/timovy_projekt/resers/README.md index 2583105987..fad8f8b5a2 100644 --- a/pages/students/2016/darius_lindvai/timovy_projekt/resers/README.md +++ b/pages/students/2016/darius_lindvai/timovy_projekt/resers/README.md @@ -35,3 +35,8 @@ Experimenty, ktoré autori vykonali na Britskom národnom korpuse (*British nati Predošlé modely používali k činnosti akustické príznaky, lexikálne príznaky, alebo ich kombináciu. Využitie akustických príznakov textu sa javí ako efektívnejšie ako využitie samotných lexikálnych príznakov. Avšak v mnohých prípadoch ich nie je možné použiť v ASR, nakoľko ľudia pri hovorení zvyknú používať pauzy medzi slovami na miestach, kde by ich používať nemali. Kombinovanie týchto dvoch typov príznakov (akustické a lexikálne) čiastočne vyrieši tento problém. Veľa štúdií používa lexikálne dáta, ktoré však musia mať pridelené rečové údaje (bodky, čiarky, pauzy medzi slovami, a podobne), čo však spôsobuje komplikácie a limituje používanie čisto lexikálnych dát. Výsledky experimentov, ktoré bolo vykonané na korpuse “English IWSLT2011”, ukazujú, že model založený na “self-attention”, ktorý používa “word and speech embeddings” dosahuje oveľa lepšie výsledky a väčšiu rýchlosť ako viacero modelov slúžiacich na doplňovanie interpunkcie. + +[1] NGUYEN, B. a kol.: *Fast and Accurate Capitalization and Punctuation for Automatic Speech Recognition Using Transformer and Chunk Merging.* [online] [citované 07-08-2019] URL: + +[2] YI, J. a kol.: *Self-attention Based Model for Punctuation Prediction Using Word and Speech Embeddings.* [online] [citované 17-04-2019] URL: + diff --git a/pages/students/2016/darius_lindvai/timovy_projekt/tutorial/README.md b/pages/students/2016/darius_lindvai/timovy_projekt/tutorial/README.md index 62d2133515..cc947e06ea 100755 --- a/pages/students/2016/darius_lindvai/timovy_projekt/tutorial/README.md +++ b/pages/students/2016/darius_lindvai/timovy_projekt/tutorial/README.md @@ -1,5 +1,4 @@ - # PYTORCH - LSTM TUTORIÁL ### Čo je to Pytorch? @@ -157,3 +156,4 @@ Na výstupe by sa mal objaviť tvar výstupných tensorov a taktiež samotné te Output shape: torch.Size([1, 1, 10]) Hidden: (tensor([[[-0.3184, 0.0795, -0.2122, -0.0699, -0.1824, -0.1231, -0.1314, 0.3096, -0.0371, 0.0488]]], grad_fn=), tensor([[[-0.5415, 0.2349, -0.4794, -0.1918, -0.2433, -0.2443, -0.2989, 0.5557, -0.0896, 0.1062]]], grad_fn=)) ``` +