--- title: Martin NaN1 published: true taxonomy: category: [bp2021] tag: [demo,nlp,nemo,bert,gpt] author: Anton Buday --- # Nan1_name Rok začiatku štúdia: 2018 Podmienkou pre získanie zápočtu je účasť na konzultácii min. raz za 2 týždne. Menej ako 6 konzultácií za semester je dôvod pre zníženie hodnotenia alebo neudelenie zápočtu. Komunikácia je možná aj cez MS Teams, Cisco Webex... Konzultačné hodiny sú podľa dohody, preferujem chat na MS Teams. ## Bakalársky projekt 2020 Názov: Využitie najnovších nástrojov v rámci prirodzeného spracovania reči Cieľ: - Pokúsiť sa použiť slovenské dáta na spracovanie prirodzeného jazyka v prostredí zvoleného nástroja Návrh na zadanie: 1. Vyberte a naštudujte najnovšie a najvýznamnejšie metódy spracovania prirodzeného jazyka. 2. Vypracujte základnú teóriu k zvolenej metóde a nástroju na spracovanie textu. 3. Vytvorte demonštračnú webovú aplikáciu pomocou ktorej je možné vyskúšať zvolenú metódu. 4. Navrhnite možné zlepšenia Vašej práce z hľadiska výberu architektúry, nástroja alebo metódy spracovania textu. Zásobník úloh: - Vytvorte si repozitár na GITe, nazvite ho bp2021. Do neho budete dávať kódy a dokumentáciu, ktorú vytvoríte. Virtuálne stretnutie <TBD>. Stav: - prečítajte si niečo o NLP: - odporúčam zdroje ako arxiv, blogy z medium.com - https://colab.research.google.com/github/NVIDIA/NeMo/blob/main/tutorials/nlp/GLUE_Benchmark.ipynb#scrollTo=daYw_Xll2ZR9 - https://colab.research.google.com/github/NVIDIA/NeMo/blob/main/tutorials/NeMo_voice_swap_app.ipynb#scrollTo=I9eIxAyKHREB - https://github.com/pytorch/fairseq/tree/master/examples/roberta - zistite čo je to NER, POS. - https://www.youtube.com/embed/wBgpMf_KQVw //NeMO, Jarvis - https://github.com/pytorch/fairseq/blob/master/examples/wav2vec/README.md Úlohy do ďalšieho stretnutia: - - Stretnutie x.yy.2O20: Na štúdium: - - Na vypracovanie: - - Na zlepšenie: - Chceme vybrať metódu NLP ktorej sa budeme venovať. - chceme vybrať knižnicu alebo demo ktoré budeme prezentovať.