forked from KEMT/zpwiki
53 lines
1.6 KiB
Markdown
53 lines
1.6 KiB
Markdown
---
|
|
title: Vladyslav Krupko
|
|
published: true
|
|
taxonomy:
|
|
category: [bp2023]
|
|
tag: [language model]
|
|
author: Daniel Hladek
|
|
---
|
|
|
|
rok začiatku štúdia: 2020
|
|
|
|
# Bakalárska práca 2023
|
|
|
|
Generovanie slovenského jazyka pomocou neurónovej siete
|
|
|
|
Vytvorte systém, ktorý by vedel generovať odpovede v slovenskom jazyku na základe opísaného problému.
|
|
|
|
Na naučenie neurónovej siete použite webové diskusie.
|
|
|
|
Zvážiť inú tému:
|
|
|
|
- Konverzačný agent pre prezentáciu výsledkov spracovnania prirodzeného jazyka.
|
|
|
|
Stretnutie 29.9.2022
|
|
|
|
Téma: Oprava preklepov v slovenskom jazyku.
|
|
|
|
Cieľ:
|
|
|
|
- Naštudovať si problematiku opravy preklepov a napísať prehľad aktuálnych metód.
|
|
- Vykonať jednoduchý experiment na automatickú opravu preklepov pomocou neurónovej siete.
|
|
- Naprogramovať webovú demo aplikáciu.
|
|
|
|
Úlohy:
|
|
|
|
- Prečítajte si článok "Survey of Automatic Spelling Correction" a napíšte z neho poznámky na cca 2 strany.
|
|
- Prečítajte si článok Comparison of recurrent neural networks for slovak punctuation restoration.
|
|
- Zistite, ako funguje neurónový strojový preklad. Prečítajte si niekoľko blogov a napíšte si poznámky na jednu stranu, uveďte aj odkazy na články. Kľúčové slovíčko je enkóder-dekóder architektúra.
|
|
- Nainštalujte si systém Anaconda.
|
|
- Nainštalujte si knižnicu Pytorch
|
|
- Nainštalujte si systém Fairseq
|
|
- Prejdite si aspoň jeden fairseq tutoriál, napr. https://fairseq.readthedocs.io/en/latest/tutorial_simple_lstm.html
|
|
|
|
|
|
Zásobník úloh:
|
|
|
|
- Vybrať dáta a urobiť experiment.
|
|
- naprogramovať demo.
|
|
|
|
|
|
|
|
|