added pages to tp2019

This commit is contained in:
Daniel Hladek 2020-10-02 15:56:17 +02:00
parent 78623e11a3
commit 70624b3630
7 changed files with 60 additions and 5 deletions

View File

@ -1,4 +1,11 @@
---
title: Novinky v oblasti “Punctuation Restoration”
published: true
taxonomy:
category: [tp2019]
tag: [interpunction,nlp]
author: Dárius Lindvai
---
# Novinky v oblasti “Punctuation Restoration”
Keďže interpunkcia a veľké písmená v slovách nemajú vplyv na výslovnosť slov, sú z výstupu **ASR** (*automatic speech recognition = automatické rozpoznávanie reči*) odstraňované, výsledkom čoho sú iba sekvencie slov alebo písmen. Systémy vykonávajúce doplňovanie **interpunkčných znamienok** a veľkých písmen sú potrebné najmä preto, lebo tieto výstupy bez interpunkcie a veľkých písmen väčšinou pre ľudí nie sú zrozumiteľné (v textovej forme). Interpunkcia a veľké písmená sú taktiež dôležité prvky aj pri **NLP** (*natural language processing = spracovanie prirodzeného jazyka*).

View File

@ -1,4 +1,11 @@
---
title: Novinky v oblasti “Punctuation Restoration”
published: true
taxonomy:
category: [tp2019]
tag: [python,lstm,nn,nlp,pytorch,anaconda]
author: Dárius Lindvai
---
# PYTORCH - LSTM TUTORIÁL
### Čo je to Pytorch?

View File

@ -1,3 +1,11 @@
---
title: Dominik Nagy
published: true
taxonomy:
category: [tp2019]
tag: [nn,seq2seq,translation,nlp]
author: Dominik Nagy
---
# Sequence-to-sequence
Hlboké neurónové siete (Deep Neural Networks DNN) sú veľmi výkonné modely strojového

View File

@ -1,3 +1,11 @@
---
title: Crowdsourcing
published: true
taxonomy:
category: [tp2019]
tag: [annotation,nlp]
author: Jakub Maruniak
---
**Crowdsourcing**
Čo je to crowdsourcing? Výraz _crowdsourcing_ bol prvý krát použitý v júni 2006, kedy editor magazínu Wired, Jeff Howe, vydal článok „The Rise of Crowdsourcing" [1]. V tomto článku a v ďalších príspevkoch na svojom blogu popisuje novú organizačnú formu, koncept, pri ktorom je problém zadaný neznámej skupine riešiteľov. Zákazníci, alebo žiadatelia môžu uverejniť požadované úlohy na crowdsourcingovú platformu, kde dodávatelia skupina, alebo jednotlivci vykonajú tieto úlohy na základe ich záujmov a schopností [2].
@ -87,4 +95,4 @@ Model crowdsourcingu pre vytváranie korpusu môže mať 3 formy. Prvou formou j
[24] D. Jurgens and R. Navigli, "It's All Fun and Games until Someone Annotates: Video Games with a Purpose for Linguistic Annotation."
[25] "Live Demo · Prodigy · An annotation tool for AI, Machine Learning & NLP." [Online]. Available: https://prodi.gy/demo?view\_id=ner. [Accessed: 12-Nov-2019].
[25] "Live Demo · Prodigy · An annotation tool for AI, Machine Learning & NLP." [Online]. Available: https://prodi.gy/demo?view\_id=ner. [Accessed: 12-Nov-2019].

View File

@ -1,3 +1,11 @@
---
title: Získavanie informácií
published: true
taxonomy:
category: [tp2019]
tag: [ir,nlp]
author: Ján Holp
---
# Tímový projekt
# Learning to Rank for Information Retrieval and Natural Language Processing
@ -68,4 +76,4 @@ Kde w označuje slovo v dokumente d, a q, t𝒇(𝒘) označujú frekvenciu slov
[9] Langville, Amy N.; Meyer, Carl D. (2006). Google's PageRank and Beyond: The Science of Search Engine Rankings. Princeton University Press, [ cit. 19.december. 2019 ].
[10] Michael Bendersky,W.Bruce Croft,andYanlei Diao. Quality-biased ranking of web documents. InWSDM,pages 95104,2011, [cit. 19.december. 2019 ].
[10] Michael Bendersky,W.Bruce Croft,andYanlei Diao. Quality-biased ranking of web documents. InWSDM,pages 95104,2011, [cit. 19.december. 2019 ].

View File

@ -1,3 +1,12 @@
---
title: Paralelné spracovanie
published: true
taxonomy:
category: [tp2019]
tag: [gpu,nlp]
author: Lukáš Pokrývka
---
**Paralelné spracovanie**
Systémy na spracovanie prirodzeného jazyka (_z angl. Natural Language Processing_ ďalej už len NLP), boli ešte v nedávnej minulosti založené na sériových algoritmoch, ktoré simulovali spôsob, ktorým ľudia čítajú text slovo za slovom, riadok po riadku [1]. Keďže týmto štýlom boli prezentované všetky gramatické teórie, programátori ich týmto štýlom aj implementovali.
@ -91,4 +100,4 @@ V porovnaní s Word2vec bol pridaný nový algoritmus. Tento algoritmus berie do
[11]. Joulin A. Grave E. Bojanowski P. et al. Bag of Tricks for Efficient Text Classification. [Online]. 15th Conference of the European Chapter of the Association for Computational Linguistic, EACL 2017 [cit. 11.11.2019] Dostupné na internete: \<[https://arxiv.org/pdf/1607.01759.pdf](https://arxiv.org/pdf/1607.01759.pdf)\>
[12]. Joulin A. Grave E. Bojanowski P. et al. FastText.zip: Compressing Text Classification Models. [Online]. ICLR, 2017. [cit. 11.11.2019] Dostupné na internete: \<[https://arxiv.org/pdf/1612.03651.pdf](https://arxiv.org/pdf/1612.03651.pdf)\>
[12]. Joulin A. Grave E. Bojanowski P. et al. FastText.zip: Compressing Text Classification Models. [Online]. ICLR, 2017. [cit. 11.11.2019] Dostupné na internete: \<[https://arxiv.org/pdf/1612.03651.pdf](https://arxiv.org/pdf/1612.03651.pdf)\>

View File

@ -1,3 +1,11 @@
---
title: Spracovanie prirodzeného jazyka
published: true
taxonomy:
category: [tp2019]
tag: [spacy,nlp]
author: Maroš Harahus
---
# NLP
Je založený na umelej inteligencii, ktorá sa zaoberá interakciami medzi počítačom a jazykmi. NLP uľahčuje proces analýzy a