forked from KEMT/zpwiki
added pages to tp2019
This commit is contained in:
parent
78623e11a3
commit
70624b3630
@ -1,4 +1,11 @@
|
||||
|
||||
---
|
||||
title: Novinky v oblasti “Punctuation Restoration”
|
||||
published: true
|
||||
taxonomy:
|
||||
category: [tp2019]
|
||||
tag: [interpunction,nlp]
|
||||
author: Dárius Lindvai
|
||||
---
|
||||
# Novinky v oblasti “Punctuation Restoration”
|
||||
|
||||
Keďže interpunkcia a veľké písmená v slovách nemajú vplyv na výslovnosť slov, sú z výstupu **ASR** (*automatic speech recognition = automatické rozpoznávanie reči*) odstraňované, výsledkom čoho sú iba sekvencie slov alebo písmen. Systémy vykonávajúce doplňovanie **interpunkčných znamienok** a veľkých písmen sú potrebné najmä preto, lebo tieto výstupy bez interpunkcie a veľkých písmen väčšinou pre ľudí nie sú zrozumiteľné (v textovej forme). Interpunkcia a veľké písmená sú taktiež dôležité prvky aj pri **NLP** (*natural language processing = spracovanie prirodzeného jazyka*).
|
||||
|
@ -1,4 +1,11 @@
|
||||
|
||||
---
|
||||
title: Novinky v oblasti “Punctuation Restoration”
|
||||
published: true
|
||||
taxonomy:
|
||||
category: [tp2019]
|
||||
tag: [python,lstm,nn,nlp,pytorch,anaconda]
|
||||
author: Dárius Lindvai
|
||||
---
|
||||
# PYTORCH - LSTM TUTORIÁL
|
||||
|
||||
### Čo je to Pytorch?
|
||||
|
@ -1,3 +1,11 @@
|
||||
---
|
||||
title: Dominik Nagy
|
||||
published: true
|
||||
taxonomy:
|
||||
category: [tp2019]
|
||||
tag: [nn,seq2seq,translation,nlp]
|
||||
author: Dominik Nagy
|
||||
---
|
||||
# Sequence-to-sequence
|
||||
|
||||
Hlboké neurónové siete (Deep Neural Networks – DNN) sú veľmi výkonné modely strojového
|
||||
|
@ -1,3 +1,11 @@
|
||||
---
|
||||
title: Crowdsourcing
|
||||
published: true
|
||||
taxonomy:
|
||||
category: [tp2019]
|
||||
tag: [annotation,nlp]
|
||||
author: Jakub Maruniak
|
||||
---
|
||||
**Crowdsourcing**
|
||||
|
||||
Čo je to crowdsourcing? Výraz _crowdsourcing_ bol prvý krát použitý v júni 2006, kedy editor magazínu Wired, Jeff Howe, vydal článok „The Rise of Crowdsourcing" [1]. V tomto článku a v ďalších príspevkoch na svojom blogu popisuje novú organizačnú formu, koncept, pri ktorom je problém zadaný neznámej skupine riešiteľov. Zákazníci, alebo žiadatelia môžu uverejniť požadované úlohy na crowdsourcingovú platformu, kde dodávatelia – skupina, alebo jednotlivci vykonajú tieto úlohy na základe ich záujmov a schopností [2].
|
||||
@ -87,4 +95,4 @@ Model crowdsourcingu pre vytváranie korpusu môže mať 3 formy. Prvou formou j
|
||||
|
||||
[24] D. Jurgens and R. Navigli, "It's All Fun and Games until Someone Annotates: Video Games with a Purpose for Linguistic Annotation."
|
||||
|
||||
[25] "Live Demo · Prodigy · An annotation tool for AI, Machine Learning & NLP." [Online]. Available: https://prodi.gy/demo?view\_id=ner. [Accessed: 12-Nov-2019].
|
||||
[25] "Live Demo · Prodigy · An annotation tool for AI, Machine Learning & NLP." [Online]. Available: https://prodi.gy/demo?view\_id=ner. [Accessed: 12-Nov-2019].
|
||||
|
@ -1,3 +1,11 @@
|
||||
---
|
||||
title: Získavanie informácií
|
||||
published: true
|
||||
taxonomy:
|
||||
category: [tp2019]
|
||||
tag: [ir,nlp]
|
||||
author: Ján Holp
|
||||
---
|
||||
# Tímový projekt
|
||||
|
||||
# Learning to Rank for Information Retrieval and Natural Language Processing
|
||||
@ -68,4 +76,4 @@ Kde w označuje slovo v dokumente d, a q, t𝒇(𝒘) označujú frekvenciu slov
|
||||
|
||||
[9] Langville, Amy N.; Meyer, Carl D. (2006). Google's PageRank and Beyond: The Science of Search Engine Rankings. Princeton University Press, [ cit. 19.december. 2019 ].
|
||||
|
||||
[10] Michael Bendersky,W.Bruce Croft,andYanlei Diao. Quality-biased ranking of web documents. InWSDM,pages 95–104,2011, [cit. 19.december. 2019 ].
|
||||
[10] Michael Bendersky,W.Bruce Croft,andYanlei Diao. Quality-biased ranking of web documents. InWSDM,pages 95–104,2011, [cit. 19.december. 2019 ].
|
||||
|
@ -1,3 +1,12 @@
|
||||
---
|
||||
title: Paralelné spracovanie
|
||||
published: true
|
||||
taxonomy:
|
||||
category: [tp2019]
|
||||
tag: [gpu,nlp]
|
||||
author: Lukáš Pokrývka
|
||||
---
|
||||
|
||||
**Paralelné spracovanie**
|
||||
|
||||
Systémy na spracovanie prirodzeného jazyka (_z angl. Natural Language Processing_ – ďalej už len NLP), boli ešte v nedávnej minulosti založené na sériových algoritmoch, ktoré simulovali spôsob, ktorým ľudia čítajú text – slovo za slovom, riadok po riadku [1]. Keďže týmto štýlom boli prezentované všetky gramatické teórie, programátori ich týmto štýlom aj implementovali.
|
||||
@ -91,4 +100,4 @@ V porovnaní s Word2vec bol pridaný nový algoritmus. Tento algoritmus berie do
|
||||
|
||||
[11]. Joulin A. – Grave E. – Bojanowski P. et al. Bag of Tricks for Efficient Text Classification. [Online]. 15th Conference of the European Chapter of the Association for Computational Linguistic, EACL 2017 [cit. 11.11.2019] Dostupné na internete: \<[https://arxiv.org/pdf/1607.01759.pdf](https://arxiv.org/pdf/1607.01759.pdf)\>
|
||||
|
||||
[12]. Joulin A. – Grave E. – Bojanowski P. et al. FastText.zip: Compressing Text Classification Models. [Online]. ICLR, 2017. [cit. 11.11.2019] Dostupné na internete: \<[https://arxiv.org/pdf/1612.03651.pdf](https://arxiv.org/pdf/1612.03651.pdf)\>
|
||||
[12]. Joulin A. – Grave E. – Bojanowski P. et al. FastText.zip: Compressing Text Classification Models. [Online]. ICLR, 2017. [cit. 11.11.2019] Dostupné na internete: \<[https://arxiv.org/pdf/1612.03651.pdf](https://arxiv.org/pdf/1612.03651.pdf)\>
|
||||
|
@ -1,3 +1,11 @@
|
||||
---
|
||||
title: Spracovanie prirodzeného jazyka
|
||||
published: true
|
||||
taxonomy:
|
||||
category: [tp2019]
|
||||
tag: [spacy,nlp]
|
||||
author: Maroš Harahus
|
||||
---
|
||||
# NLP
|
||||
|
||||
Je založený na umelej inteligencii, ktorá sa zaoberá interakciami medzi počítačom a jazykmi. NLP uľahčuje proces analýzy a
|
||||
|
Loading…
Reference in New Issue
Block a user