dmytro_ushatenko/pages/students/2018/ondrej_megela
2020-11-13 09:37:48 +00:00
..
README.md Update 'pages/students/2018/ondrej_megela/README.md' 2020-11-13 09:37:48 +00:00

title published taxonomy
Ondrej Megela true
category tag author
bp2021
nlp
fairseq
lm
Daniel Hladek

Ondrej Megela

Začiatok štúdia: 2018

Bakalársky projekt 2020

Názov: Neurónové jazykové modelovanie s pomocou nástroja Fairseq

Návrh na zadanie:

  1. Vypracujte prehľad metód jazykového modelovania pomoocu neurónových sietí
  2. Vytvorte jazykový model metódou BERT alebo podobnou metódou.
  3. Vyhodnnotte vytvorený jazykový model a navrhnite zlepšenia.

Virtuálne stretnutie 13.11.2020

Stav:

  • Vypracované poznámky aj k transformer a BERT
  • Vyskúšaná release verzia Fairseq. Stále trvá technický problém s tutoriálom.
  • Vyskúšaný BERT tutoriáli. Chyba "illegal instruction" pri extrahovaní príznakov "extract features from ROBERTA".

Virtuálne stretnutie 30.10.2020

Stav:

  • Vypracované poznámky k seq2seq
  • nainštalovaný Pytorch a fairseq
  • problémy s tutoriálom. Riešenie by mohlo byť použitie release verzie 0.9.0, pip install fairseq=0.9.0

Do ďalšieho stretnutia:

Virtuálne stretnutie 16.10.2020

Stav:

  • Vypracované poznámky k uvedeným bodom.
  • Problém s inštaláciou Anaconda.

Do ďalieho stretnutia:

Virtuálne stretnutie 2.10.2020

Vytvorený prístup ssh megela@idoc.fei.tuke.sk

Úlohy do ďalšieho stretnutia:

  • Naštudujte si a vyracujte poznámky s uvedením zdroja:
    • spracovanie prirodzeného jazyka
    • jazykové modelovanie
    • rekurentná neurónová sieť
    • architektúra enkóder dekóder alebo seq2seq
  • Nainštalujte si prostredie Anaconda, pytorch a knižnicu fairseq

Na štúdium:

https://git.kemt.fei.tuke.sk/KEMT/zpwiki/src/branch/master/pages/topics

  • python
  • nlp
  • seq2seq