dmytro_ushatenko/pages/students/2016/dominik_nagy/README.md

3.2 KiB

title published taxonomy
Dominik Nagy true
category tag author
dp2021
bp2019
translation
nlp
Daniel Hladek

Dominik Nagy

Rok začiatku štúdia: 2016

Diplomová práca 2021

Názov diplomovej práce: Prepis postupností pomocou neurónových sietí pre strojový preklad

Meno vedúceho: Ing. Daniel Hládek, PhD.

Zadanie diplomovej práce:

  1. Vypracujte teoretický prehľad metód "sequence to sequence".
  2. Pripravte si dátovú množinu na trénovanie modelu sequence to sequence pre úlohu strojového prekladu.
  3. Vyberte minimálne dva rôzne modely a porovnajte ich presnosť na vhodnej dátovej množine.
  4. Na základe výsledkov experimentov navrhnite zlepšenia.

Diplomový projekt 2

Virtuálne stretnutie 25.9.

  • Možnosť predĺženia štúdia
  • Inak pokračovať v otvorených úlohách

Úlohy na ďalšie stretnutie:

  • pozrieť a pripraviť česko-slovenský paralelný korpus, natrénovať a vyhodnotiť model
  • pozrieť a pripraviť anglicko-slovenský paralelný korpus, natrénovať a vyhodnotiť model

Diplomový projekt 1 2020

Literatúra:

Neural Network Methods for Natural Language Processing

Úlohy na semester:

  • Získať a pripraviť slovenský paralelný korpus pre preklad do angličtiny a češtiny
  • Natrénovať a vyhodnotiť Fairseq Model

Virtuálne stretnutie 30.7.2020:

Dohoda na opakovaní predmetu.

Virtuálne stretnutie 14.5.2020:

Urobené: rozbehaný tutoriál fairseq pre trénovanie nemecko anglických dát

Úlohy na ďalšie stretnutie:

  • pozrieť a pripraviť česko-slovenský paralelný korpus, natrénovať a vyhodnotiť model
  • pozrieť a pripraviť anglicko-slovenský paralelný korpus, natrénovať a vyhodnotiť model

Stretnutie 6.3.2020.

Úloha na ďalšie stretnutie:

Tímový projekt 2019

Písomná práca: Rešerš na tému "Sequnce to Sequence"

Úlohy tímového projektu:

Poznámky

Projektové stránky:

V prípade záujmu je možné pracovať na úlohe strojového prekladu.

Možné trénovacie dáta: https://www.clarin.eu/resource-families/parallel-corpora