From a987c2cca369cf8e50d5803f2e1abd8bedfa13f4 Mon Sep 17 00:00:00 2001 From: dano Date: Wed, 15 Jan 2020 13:33:47 +0000 Subject: [PATCH] Update 'pages/teachers/hladek/subjects/dp2021/README.md' --- pages/teachers/hladek/subjects/dp2021/README.md | 16 +++++++++++++++- 1 file changed, 15 insertions(+), 1 deletion(-) diff --git a/pages/teachers/hladek/subjects/dp2021/README.md b/pages/teachers/hladek/subjects/dp2021/README.md index 0bbd29bd..d9facf7e 100644 --- a/pages/teachers/hladek/subjects/dp2021/README.md +++ b/pages/teachers/hladek/subjects/dp2021/README.md @@ -13,7 +13,6 @@ published: true - [Lukáš Pokrývka](../../../../students/2016/lukas_pokryvka) "Paralelné trénovanie sémantických modelov prirodzeného jazyka" (word2vec, word embeddings, GloVe, fastText) - [Ján Holp](../../../../students/2016/jan_holp) (získavanie informácií) - Dominik Nagy (spelling correction, fairseq) - - Dárius Lindvai (punctuation restoration, [tutorial](https://medium.com/@praneethbedapudi/deepcorrection2-automatic-punctuation-restoration-ac4a837d92d9), pytorch, LSTM tutorial) - Jakub Maruniak (prodigy, vytvorenie korpusu, [named-entity](../prodigy), @@ -107,3 +106,18 @@ Dominik Nagy: - Vypracujte min. 4 stranový rešerš na tému: "Sequence to Sequence" (Encoder-Decoder, seq2seq, transformer, attention) - citujte min. 10 najvýznamnejších bibliografických zdrojov + +15.1.2020: +- Prečítajte si o [konvolučných sieťach](http://www.wildml.com/2015/11/understanding-convolutional-neural-networks-for-nlp/) +- Prečítajte si Sequence to Sequence Convolutional Neural Network for Automatic +Spelling Correction +- Skúste si nainštalovať nástroj fairseq +- prejdite si tutoriál https://github.com/pytorch/fairseq/blob/master/examples/translation/README.md + + +Návrh na zadanie DP: + +- Vypracujte teoretický prehľad metód "sequence to sequence". +- Pripravte si dátovú množinu na trénovnie modelu sequence to sequence pre úlohu opravy preklepov. +- Vyberte minmálne dva rôzne modely a porovnajte ich presnosť na vhodnej dátovej množine. +- Na základe výsledkov experimentov navrhnite zlepšenia \ No newline at end of file