2020-01-17 13:49:32 +00:00
|
|
|
# Dominik Nagy
|
2020-01-29 05:37:04 +00:00
|
|
|
|
|
|
|
*Rok začiatku štúdia*: 2016
|
|
|
|
|
2020-03-06 09:21:05 +00:00
|
|
|
## Diplomový projekt 1 2020
|
|
|
|
|
2020-03-06 09:30:10 +00:00
|
|
|
Literatúra:
|
|
|
|
|
|
|
|
[Neural Network Methods for Natural Language Processing](https://www.morganclaypool.com/doi/abs/10.2200/S00762ED1V01Y201703HLT037)
|
|
|
|
|
2020-03-06 09:21:05 +00:00
|
|
|
Úlohy na semester:
|
|
|
|
|
|
|
|
- Získať a pripraviť slovenský paralelný korpus pre preklad do angličtiny a češtiny
|
|
|
|
- Natrénovať a vyhodnotiť Fairseq Model
|
|
|
|
|
|
|
|
|
|
|
|
Stretnutie 6.3.2020.
|
|
|
|
|
|
|
|
Úloha na ďalšie stretnutie:
|
|
|
|
|
|
|
|
- spustiť Trénovanie Fairseq na idoc
|
|
|
|
- Pozrieť dostupné [jazykové zdroje](/topics/resources)
|
2020-03-06 09:30:10 +00:00
|
|
|
- Pozrieť článok [fairseq: A Fast, Extensible Toolkit for Sequence Modeling](https://www.aclweb.org/anthology/N19-4009/)
|
|
|
|
- Pozrieť prístup a článok https://github.com/pytorch/fairseq/blob/master/examples/joint_alignment_translation/README.md
|
2020-03-06 09:21:05 +00:00
|
|
|
|
|
|
|
## Diplomová práca 2021
|
|
|
|
|
|
|
|
*Názov diplomovej práce*: Prepis postupností pomocou neurónových sietí pre strojový preklad
|
|
|
|
|
|
|
|
*Meno vedúceho*: Ing. Daniel Hládek, PhD.
|
|
|
|
|
|
|
|
*Zadanie diplomovej práce*:
|
|
|
|
|
|
|
|
1. Vypracujte teoretický prehľad metód "sequence to sequence".
|
|
|
|
2. Pripravte si dátovú množinu na trénovanie modelu sequence to sequence pre úlohu strojového prekladu.
|
|
|
|
3. Vyberte minimálne dva rôzne modely a porovnajte ich presnosť na vhodnej dátovej množine.
|
|
|
|
4. Na základe výsledkov experimentov navrhnite zlepšenia.
|
|
|
|
|
2020-01-17 13:49:32 +00:00
|
|
|
## Tímový projekt 2019
|
|
|
|
|
2020-01-29 05:37:04 +00:00
|
|
|
*Písomná práca*: [Rešerš na tému "Sequnce to Sequence"](./timovy_projekt/README.md)
|
|
|
|
|
|
|
|
*Úlohy tímového projektu*:
|
|
|
|
|
2020-02-07 09:50:13 +00:00
|
|
|
- Vypracujte min. 4 stranový rešerš na tému: "Sequence to Sequence" (Encoder-Decoder, seq2seq, transformer, attention)
|
|
|
|
- citujte min. 10 najvýznamnejších bibliografických zdrojov
|
|
|
|
- Prečítajte si o [konvolučných sieťach](http://www.wildml.com/2015/11/understanding-convolutional-neural-networks-for-nlp/)
|
|
|
|
- Prečítajte si Sequence to Sequence Convolutional Neural Network for Automatic Spelling Correction
|
|
|
|
- Skúste si nainštalovať nástroj fairseq
|
|
|
|
- prejdite si tutoriál https://github.com/pytorch/fairseq/blob/master/examples/translation/README.md
|
|
|
|
|
2020-01-29 05:37:04 +00:00
|
|
|
### Poznámky
|
|
|
|
|
2020-01-23 10:08:04 +00:00
|
|
|
Projektové stránky:
|
|
|
|
|
2020-01-25 16:25:37 +00:00
|
|
|
- [Spracovanie prirodzeného jazyka](/topics/nlp)
|
2020-01-25 16:27:48 +00:00
|
|
|
- [Python](/topics/python)
|
2020-01-25 16:28:47 +00:00
|
|
|
- [Sequence to Sequence](/topics/seq2seq)
|
2020-01-23 10:08:04 +00:00
|
|
|
|
2020-01-29 05:37:04 +00:00
|
|
|
V prípade záujmu je možné pracovať na úlohe strojového prekladu.
|
2020-01-23 10:08:04 +00:00
|
|
|
|
2020-01-29 05:37:04 +00:00
|
|
|
Možné trénovacie dáta: https://www.clarin.eu/resource-families/parallel-corpora
|
2020-01-17 13:49:32 +00:00
|
|
|
|