forked from KEMT/zpwiki
2.6 KiB
2.6 KiB
Dominik Nagy
Rok začiatku štúdia: 2016
Diplomový projekt 1 2020
Literatúra:
Neural Network Methods for Natural Language Processing
Úlohy na semester:
- Získať a pripraviť slovenský paralelný korpus pre preklad do angličtiny a češtiny
- Natrénovať a vyhodnotiť Fairseq Model
Virtuálne stretnutie 14.5.2020:
Urobené: rozbehaný tutoriál fairseq pre trénovanie nemecko anglických dát
Úlohy na ďalšie stretnutie:
- pozrieť a pripraviť česko-slovenský paralelný korpus, natrénovať a vyhodnotiť model
- pozrieť a pripraviť anglicko-slovenský paralelný korpus, natrénovať a vyhodnotiť model
Stretnutie 6.3.2020.
Úloha na ďalšie stretnutie:
- spustiť Trénovanie Fairseq na idoc
- Pozrieť dostupné jazykové zdroje
- Pozrieť článok fairseq: A Fast, Extensible Toolkit for Sequence Modeling
- Pozrieť prístup a článok https://github.com/pytorch/fairseq/blob/master/examples/joint_alignment_translation/README.md
Diplomová práca 2021
Názov diplomovej práce: Prepis postupností pomocou neurónových sietí pre strojový preklad
Meno vedúceho: Ing. Daniel Hládek, PhD.
Zadanie diplomovej práce:
- Vypracujte teoretický prehľad metód "sequence to sequence".
- Pripravte si dátovú množinu na trénovanie modelu sequence to sequence pre úlohu strojového prekladu.
- Vyberte minimálne dva rôzne modely a porovnajte ich presnosť na vhodnej dátovej množine.
- Na základe výsledkov experimentov navrhnite zlepšenia.
Tímový projekt 2019
Písomná práca: Rešerš na tému "Sequnce to Sequence"
Úlohy tímového projektu:
- Vypracujte min. 4 stranový rešerš na tému: "Sequence to Sequence" (Encoder-Decoder, seq2seq, transformer, attention)
- citujte min. 10 najvýznamnejších bibliografických zdrojov
- Prečítajte si o konvolučných sieťach
- Prečítajte si Sequence to Sequence Convolutional Neural Network for Automatic Spelling Correction
- Skúste si nainštalovať nástroj fairseq
- prejdite si tutoriál https://github.com/pytorch/fairseq/blob/master/examples/translation/README.md
Poznámky
Projektové stránky:
V prípade záujmu je možné pracovať na úlohe strojového prekladu.
Možné trénovacie dáta: https://www.clarin.eu/resource-families/parallel-corpora