| .. | ||
| dp2021 | ||
| timovy_projekt | ||
| README.md | ||
Dárius Lindvai
Rok začiatku štúdia: 2016
Diplomový projekt 2020
Revízia 17.4.2020:
- Upravené zdrojové kódy BiLSTM+CRF pre Punctuation Restoration
 - repozitár dp2021
 
Nové úlohy:
- Pripravte si trénovaciu a testovaciu množinu.
 - Natrénujte neurónovú sieť na väčších dátach, použite server idoc.
 - Vyhodnnotte presnosť vo forme Precision-Recall pre každú triedu
 
Stretnutie 9.3.2020:
Pozrieť si:
- https://github.com/sgrvinod/a-PyTorch-Tutorial-to-Sequence-Labeling
 - Comparison of Recurrent Neural Networks for Slovak Punctuation Restoration (poslané emailom)
 
Skúste upraviť kódy:
- https://pytorch.org/tutorials/beginner/nlp/advanced_tutorial.html
 - repozitár https://git.kemt.fei.tuke.sk/dano/comma
 
na problém dopĺňania interpunkcie.
Na ďalšie stretnutie rozbehané kódy.
Stretnutie 20.2.2020
Úlohy na diplomový projekt:
- 
- Vybrať a pripraviť dátovú množinu na natrénovanie
 
 - 
- Vybrať a implementovať neurónovú sieť
 
 - 
- Vykonať sadu experimentov na overenie presnosti klasifikácie zvolenej neurónovej siete
 
 
Úlohy na ďalšie stretnutie:
- Ako zmeniť postupnosť slov na postupnosť vektorov?
 - [Slovo na číslo] (https://hackernoon.com/what-is-one-hot-encoding-why-and-when-do-you-have-to-use-it-e3c6186d008f)
 - Ako použiť postupnosť vektorov na natrénovanie neurónovej siete?
 - Sequence Tagging, Vocab
 
Návrh na zadanie DP
Názov: Obnovenie interpunkcie pomocou neurónových sietí
- Vypracujte prehľad metód na obnovenie interpunkcie pomocou neurónových sietí.
 - Vyberte vhodnú metódu obnovenia interpunkcie pomocou neurónových sietí.
 - Pripravte množinu dát na trénovanie neurónovej siete, navrhnite a vykonajte sadu experimentov s rôznymi parametrami.
 - Vyhodnoťte experimenty a navrhnite možné zlepšenia.
 
Tímový projekt 2019
Projektové stránky:
Úlohy na vypracovanie:
- rešerš tak na 3 strany - čo najnovšie sa píše na tému "puctuation restoration"
 - krátky program a tutoriál (program s rozsiahlym komentárom) v Pythone na využitie LSTM, napr. ako.
 - zaujímavý blog
 
Výstup TP: