diff --git a/pages/students/2016/darius_lindvai/timovy_projekt/resers/README.md b/pages/students/2016/darius_lindvai/timovy_projekt/resers/README.md index d327cf94..2401f4e3 100644 --- a/pages/students/2016/darius_lindvai/timovy_projekt/resers/README.md +++ b/pages/students/2016/darius_lindvai/timovy_projekt/resers/README.md @@ -1,4 +1,11 @@ - +--- +title: Novinky v oblasti “Punctuation Restoration” +published: true +taxonomy: + category: [tp2019] + tag: [interpunction,nlp] + author: Dárius Lindvai +--- # Novinky v oblasti “Punctuation Restoration” Keďže interpunkcia a veľké písmená v slovách nemajú vplyv na výslovnosť slov, sú z výstupu **ASR** (*automatic speech recognition = automatické rozpoznávanie reči*) odstraňované, výsledkom čoho sú iba sekvencie slov alebo písmen. Systémy vykonávajúce doplňovanie **interpunkčných znamienok** a veľkých písmen sú potrebné najmä preto, lebo tieto výstupy bez interpunkcie a veľkých písmen väčšinou pre ľudí nie sú zrozumiteľné (v textovej forme). Interpunkcia a veľké písmená sú taktiež dôležité prvky aj pri **NLP** (*natural language processing = spracovanie prirodzeného jazyka*). diff --git a/pages/students/2016/darius_lindvai/timovy_projekt/tutorial/README.md b/pages/students/2016/darius_lindvai/timovy_projekt/tutorial/README.md index cc947e06..eb6d6fae 100755 --- a/pages/students/2016/darius_lindvai/timovy_projekt/tutorial/README.md +++ b/pages/students/2016/darius_lindvai/timovy_projekt/tutorial/README.md @@ -1,4 +1,11 @@ - +--- +title: Novinky v oblasti “Punctuation Restoration” +published: true +taxonomy: + category: [tp2019] + tag: [python,lstm,nn,nlp,pytorch,anaconda] + author: Dárius Lindvai +--- # PYTORCH - LSTM TUTORIÁL ### Čo je to Pytorch? diff --git a/pages/students/2016/dominik_nagy/timovy_projekt/REAMDE.md b/pages/students/2016/dominik_nagy/timovy_projekt/REAMDE.md index 05eb4d26..6ab6f404 100644 --- a/pages/students/2016/dominik_nagy/timovy_projekt/REAMDE.md +++ b/pages/students/2016/dominik_nagy/timovy_projekt/REAMDE.md @@ -1,3 +1,11 @@ +--- +title: Dominik Nagy +published: true +taxonomy: + category: [tp2019] + tag: [nn,seq2seq,translation,nlp] + author: Dominik Nagy +--- # Sequence-to-sequence Hlboké neurónové siete (Deep Neural Networks – DNN) sú veľmi výkonné modely strojového diff --git a/pages/students/2016/jakub_maruniak/timovy_projekt/README.md b/pages/students/2016/jakub_maruniak/timovy_projekt/README.md index 43b3dd5a..87c35b20 100644 --- a/pages/students/2016/jakub_maruniak/timovy_projekt/README.md +++ b/pages/students/2016/jakub_maruniak/timovy_projekt/README.md @@ -1,3 +1,11 @@ +--- +title: Crowdsourcing +published: true +taxonomy: + category: [tp2019] + tag: [annotation,nlp] + author: Jakub Maruniak +--- **Crowdsourcing** Čo je to crowdsourcing? Výraz _crowdsourcing_ bol prvý krát použitý v júni 2006, kedy editor magazínu Wired, Jeff Howe, vydal článok „The Rise of Crowdsourcing" [1]. V tomto článku a v ďalších príspevkoch na svojom blogu popisuje novú organizačnú formu, koncept, pri ktorom je problém zadaný neznámej skupine riešiteľov. Zákazníci, alebo žiadatelia môžu uverejniť požadované úlohy na crowdsourcingovú platformu, kde dodávatelia – skupina, alebo jednotlivci vykonajú tieto úlohy na základe ich záujmov a schopností [2]. @@ -87,4 +95,4 @@ Model crowdsourcingu pre vytváranie korpusu môže mať 3 formy. Prvou formou j [24] D. Jurgens and R. Navigli, "It's All Fun and Games until Someone Annotates: Video Games with a Purpose for Linguistic Annotation." -[25] "Live Demo · Prodigy · An annotation tool for AI, Machine Learning & NLP." [Online]. Available: https://prodi.gy/demo?view\_id=ner. [Accessed: 12-Nov-2019]. \ No newline at end of file +[25] "Live Demo · Prodigy · An annotation tool for AI, Machine Learning & NLP." [Online]. Available: https://prodi.gy/demo?view\_id=ner. [Accessed: 12-Nov-2019]. diff --git a/pages/students/2016/jan_holp/timovy_projekt/README.md b/pages/students/2016/jan_holp/timovy_projekt/README.md index 63558c30..80fe1ccd 100644 --- a/pages/students/2016/jan_holp/timovy_projekt/README.md +++ b/pages/students/2016/jan_holp/timovy_projekt/README.md @@ -1,3 +1,11 @@ +--- +title: Získavanie informácií +published: true +taxonomy: + category: [tp2019] + tag: [ir,nlp] + author: Ján Holp +--- # Tímový projekt # Learning to Rank for Information Retrieval and Natural Language Processing @@ -68,4 +76,4 @@ Kde w označuje slovo v dokumente d, a q, t𝒇(𝒘) označujú frekvenciu slov [9] Langville, Amy N.; Meyer, Carl D. (2006). Google's PageRank and Beyond: The Science of Search Engine Rankings. Princeton University Press, [ cit. 19.december. 2019 ]. -[10] Michael Bendersky,W.Bruce Croft,andYanlei Diao. Quality-biased ranking of web documents. InWSDM,pages 95–104,2011, [cit. 19.december. 2019 ]. \ No newline at end of file +[10] Michael Bendersky,W.Bruce Croft,andYanlei Diao. Quality-biased ranking of web documents. InWSDM,pages 95–104,2011, [cit. 19.december. 2019 ]. diff --git a/pages/students/2016/lukas_pokryvka/timovy_projekt/README.md b/pages/students/2016/lukas_pokryvka/timovy_projekt/README.md index 9e4272f4..d8c4eb5b 100644 --- a/pages/students/2016/lukas_pokryvka/timovy_projekt/README.md +++ b/pages/students/2016/lukas_pokryvka/timovy_projekt/README.md @@ -1,3 +1,12 @@ +--- +title: Paralelné spracovanie +published: true +taxonomy: + category: [tp2019] + tag: [gpu,nlp] + author: Lukáš Pokrývka +--- + **Paralelné spracovanie** Systémy na spracovanie prirodzeného jazyka (_z angl. Natural Language Processing_ – ďalej už len NLP), boli ešte v nedávnej minulosti založené na sériových algoritmoch, ktoré simulovali spôsob, ktorým ľudia čítajú text – slovo za slovom, riadok po riadku [1]. Keďže týmto štýlom boli prezentované všetky gramatické teórie, programátori ich týmto štýlom aj implementovali. @@ -91,4 +100,4 @@ V porovnaní s Word2vec bol pridaný nový algoritmus. Tento algoritmus berie do [11]. Joulin A. – Grave E. – Bojanowski P. et al. Bag of Tricks for Efficient Text Classification. [Online]. 15th Conference of the European Chapter of the Association for Computational Linguistic, EACL 2017 [cit. 11.11.2019] Dostupné na internete: \<[https://arxiv.org/pdf/1607.01759.pdf](https://arxiv.org/pdf/1607.01759.pdf)\> -[12]. Joulin A. – Grave E. – Bojanowski P. et al. FastText.zip: Compressing Text Classification Models. [Online]. ICLR, 2017. [cit. 11.11.2019] Dostupné na internete: \<[https://arxiv.org/pdf/1612.03651.pdf](https://arxiv.org/pdf/1612.03651.pdf)\> \ No newline at end of file +[12]. Joulin A. – Grave E. – Bojanowski P. et al. FastText.zip: Compressing Text Classification Models. [Online]. ICLR, 2017. [cit. 11.11.2019] Dostupné na internete: \<[https://arxiv.org/pdf/1612.03651.pdf](https://arxiv.org/pdf/1612.03651.pdf)\> diff --git a/pages/students/2016/maros_harahus/timovy_projekt/README.md b/pages/students/2016/maros_harahus/timovy_projekt/README.md index 92dc8ffa..336da482 100644 --- a/pages/students/2016/maros_harahus/timovy_projekt/README.md +++ b/pages/students/2016/maros_harahus/timovy_projekt/README.md @@ -1,3 +1,11 @@ +--- +title: Spracovanie prirodzeného jazyka +published: true +taxonomy: + category: [tp2019] + tag: [spacy,nlp] + author: Maroš Harahus +--- # NLP Je založený na umelej inteligencii, ktorá sa zaoberá interakciami medzi počítačom a jazykmi. NLP uľahčuje proces analýzy a