dmytro_ushatenko/pages/teachers/hladek/bp2021/README.md
2020-02-27 11:30:13 +01:00

17 lines
552 B
Markdown

# Bakalárske práce 2021
## Témy
1. Neurónové jazykové modelovanie s pomocou nástroja Fairseq (seq2seq)
- vyskúšanie trénovanie niektorej metódy BERT vo fairseq
- vyhodnotenie jazykového modelu
2. Anotácia textového korpusu
- rozbehanie-pokračovanie anotačnej schémy NER alebo QA pomocou Prodigy
3. porozumenie prirodzenému jazyku pomocou nástroja RASA NLU
- proces trénovania RASA NLU
4. Vektorový model slovenského jazyka pomocou nástroja Spacy-Gensim
- natrénovanie a doplnenie Slovenského WordEmbedding modelu do Spacy