zpwiki/pages/students/2016/darius_lindvai
2020-11-06 13:55:51 +00:00
..
dp2021 update 2020-06-05 14:49:42 +02:00
timovy_projekt zz 2020-10-02 16:58:47 +02:00
README.md Update 'pages/students/2016/darius_lindvai/README.md' 2020-11-06 13:55:51 +00:00

title published taxonomy
Dárius Lindvai true
category tag author
dp2021
bp2019
nn
interpunction
nlp
Daniel Hladek

Dárius Lindvai

Rok začiatku štúdia: 2016

Repozitár so zdrojovými kódmi

Diplomový projekt 2 2020

Virtuálne stretnutie 6.11.2020

Stav:

  • Vypracovaná tabuľka s 5 experimentami.
  • vytvorený repozitár.

Na ďalšie stretnutie:

  • nahrať kódy na repozitár.
  • závislosťi (názvy balíčkov) poznačte do súboru requirements.txt.
  • Prepracujte experiment tak aby akceptoval argumenty z príkazového riadka. (sys.argv)
  • K experimentom zapísať skript na spustenie. V skripte by mali byť parametre s ktorými ste spustili experiment.
  • dopracujte report.
  • do teorie urobte prehľad metód punctuation restoration a opis Vašej metódy.

Virtuálne stretnutie 25.9.2020

Urobené:

  • skript pre vyhodnotenie experimentov.

Úlohy do ďalšieho stretnutia:

  • vytvorte nový repozitár so zdrojovými kódmi (nazvite ho dp2021)
  • vykonať a vyhodnotiť experimenty
  • Zvážiť publikovanie na http://conf.uni-obuda.hu/sami2021/paper.html
  • napísať draft na min. 4 strany s teóriou, experimantami aj bibliografipou. Môže byť aj po slovensky, potom to preložíme do nagličtiny.

Diplomový projekt 2020

Výstupy

Úlohy na diplomový projekt:

    1. Vybrať a pripraviť dátovú množinu na natrénovanie
    1. Vybrať a implementovať neurónovú sieť
    1. Vykonať sadu experimentov na overenie presnosti klasifikácie zvolenej neurónovej siete

Názov: Obnovenie interpunkcie pomocou neurónových sietí

  1. Vypracujte prehľad metód na obnovenie interpunkcie pomocou neurónových sietí.
  2. Vyberte vhodnú metódu obnovenia interpunkcie pomocou neurónových sietí.
  3. Pripravte množinu dát na trénovanie neurónovej siete, navrhnite a vykonajte sadu experimentov s rôznymi parametrami.
  4. Vyhodnoťte experimenty a navrhnite možné zlepšenia.

Zápis o činnosti

Virtuálne stretnutie 26.6.

Urobené:

  • Trénovanie modelu BiLSTM+CFR a jeho vyhodnotenie Precision Recall pre každú triedu

Treba urobiť:

  • Vyhodnotenie na testovacej množine
  • Doplnenie skriptu pre prípravu dát
  • Krátky záznam o experimentoch - stručný opis nastavenia, dát a záznam výsledkov.

Virtuálne stretnutie 14.5.2020:

Prebrali sme premenu Pytorch Tensor na NumPy Maticu

  • Pokračuje práca na Precision Recall - konfidenčná matica

Revízia 8.5.2020:

  • Práca pokračuje.
  • Precision-recall vypočítate z konfidenčnej matice takto.

Revízia 17.4.2020:

  • Upravené zdrojové kódy BiLSTM+CRF pre Punctuation Restoration
  • repozitár dp2021

Nové úlohy:

  • Pripravte si trénovaciu a testovaciu množinu.
  • Natrénujte neurónovú sieť na väčších dátach, použite server idoc.
  • Vyhodnnotte presnosť vo forme Precision-Recall pre každú triedu

Stretnutie 9.3.2020:

Pozrieť si:

Skúste upraviť kódy:

na problém dopĺňania interpunkcie.

Na ďalšie stretnutie rozbehané kódy.

Stretnutie 20.2.2020

Úlohy na ďalšie stretnutie:

Tímový projekt 2019

Projektové stránky:

Úlohy na vypracovanie:

  • rešerš tak na 3 strany - čo najnovšie sa píše na tému "puctuation restoration"
  • krátky program a tutoriál (program s rozsiahlym komentárom) v Pythone na využitie LSTM, napr. ako.
  • zaujímavý blog

Výstup TP: