forked from KEMT/zpwiki
2.2 KiB
2.2 KiB
Dárius Lindvai
Rok začiatku štúdia: 2016
Diplomový projekt 2020
Stretnutie 9.3.2020:
Pozrieť si:
- https://github.com/sgrvinod/a-PyTorch-Tutorial-to-Sequence-Labeling
- Comparison of Recurrent Neural Networks for Slovak Punctuation Restoration (poslané emailom)
Skúste upraviť kódy:
- https://pytorch.org/tutorials/beginner/nlp/advanced_tutorial.html
- repozitár https://git.kemt.fei.tuke.sk/dano/comma
na problém dopĺňania interpunkcie.
Na ďalšie stretnutie rozbehané kódy.
Stretnutie 20.2.2020
Úlohy na diplomový projekt:
-
- Vybrať a pripraviť dátovú množinu na natrénovanie
-
- Vybrať a implementovať neurónovú sieť
-
- Vykonať sadu experimentov na overenie presnosti klasifikácie zvolenej neurónovej siete
Úlohy na ďalšie stretnutie:
Pozrieť si:
- Ako zmeniť postupnosť slov na postupnosť vektorov?
- slovo na číslo https://hackernoon.com/what-is-one-hot-encoding-why-and-when-do-you-have-to-use-it-e3c6186d008f
- Ako použiť postupnosť vektorov na natrénovanie neurónovej siete?
- https://pytorch.org/text/
- Sequence Tagging
- Vocab
Návrh na zadanie DP
Názov: Obnovenie interpunkcie pomocou neurónových sietí
- Vypracujte prehľad metód na obnovenie interpunkcie pomocou neurónových sietí.
- Vyberte vhodnú metódu obnovenia interpunkcie pomocou neurónových sietí.
- Pripravte množinu dát na trénovanie neurónovej siete, navrhnite a vykonajte sadu experimentov s rôznymi parametrami.
- Vyhodnoťte experimenty a navrhnite možné zlepšenia.
Tímový projekt 2019
Projektové stránky:
Úlohy na vypracovanie:
- rešerš tak na 3 strany - čo najnovšie sa píše na tému "puctuation restoration"
- krátky program a tutoriál (program s rozsiahlym komentárom) v Pythone na využitie LSTM, napr. ako.
- zaujímavý blog
Výstup TP: