2020-01-17 13:49:32 +00:00
|
|
|
# Dominik Nagy
|
|
|
|
## Tímový projekt 2019
|
|
|
|
|
2020-01-23 10:08:04 +00:00
|
|
|
Projektové stránky:
|
|
|
|
|
2020-01-25 16:25:37 +00:00
|
|
|
- [Spracovanie prirodzeného jazyka](/topics/nlp)
|
2020-01-25 16:27:48 +00:00
|
|
|
- [Python](/topics/python)
|
2020-01-23 10:08:04 +00:00
|
|
|
- [Sequence to Sequence](../../../teachers/hladek/topics/seq2seq)
|
|
|
|
|
|
|
|
|
2020-01-17 13:49:32 +00:00
|
|
|
- Vypracujte min. 4 stranový rešerš na tému: "Sequence to Sequence" (Encoder-Decoder, seq2seq, transformer, attention)
|
|
|
|
- citujte min. 10 najvýznamnejších bibliografických zdrojov
|
|
|
|
|
|
|
|
15.1.2020:
|
|
|
|
- Prečítajte si o [konvolučných sieťach](http://www.wildml.com/2015/11/understanding-convolutional-neural-networks-for-nlp/)
|
|
|
|
- Prečítajte si Sequence to Sequence Convolutional Neural Network for Automatic
|
|
|
|
Spelling Correction
|
|
|
|
- Skúste si nainštalovať nástroj fairseq
|
|
|
|
- prejdite si tutoriál https://github.com/pytorch/fairseq/blob/master/examples/translation/README.md
|
|
|
|
|
2020-01-23 09:28:09 +00:00
|
|
|
Poznámka:
|
|
|
|
|
|
|
|
V prípade záujmu je možné pracovať na úlohe strojového prekladu.
|
|
|
|
|
|
|
|
Možné trénovacie dáta: https://www.clarin.eu/resource-families/parallel-corpora
|
|
|
|
|
2020-01-17 13:49:32 +00:00
|
|
|
## Návrh na zadanie DP
|
|
|
|
|
|
|
|
- Vypracujte teoretický prehľad metód "sequence to sequence".
|
|
|
|
- Pripravte si dátovú množinu na trénovnie modelu sequence to sequence pre úlohu opravy preklepov.
|
|
|
|
- Vyberte minmálne dva rôzne modely a porovnajte ich presnosť na vhodnej dátovej množine.
|
|
|
|
- Na základe výsledkov experimentov navrhnite zlepšenia
|