zpwiki/pages/students/2016/maros_harahus
PCKlub Vala User (MySQL) 62109d7c2d add README
2020-04-08 17:06:49 +02:00
..
timovy_projekt Aktualizovat „pages/students/2016/maros_harahus/timovy_projekt/README.md“ 2019-12-21 19:18:39 +00:00
README.md Aktualizovat „pages/students/2016/maros_harahus/README.md“ 2020-04-05 19:48:01 +00:00

Maroš Harahus

Diplomový projekt 2020

Zdroje:

Doplnenie podpory morfologického značkovania slovenského jazyka do nlp frameworku (spacy alebo flair)

Stretnutie 5.3.2020:

Úlohy na ďalšie stretnutie:

  • zobrať alebo vytvoriť fasttext model
  • pozrieť sa na spacy pretrain - tam sa bude dať využiť fasttext model
  • vložiť ho do spacy modelu pomocou spacy pretrain
  • pozrieť si http://nl.ijs.si/ME/V4/ morfosyntaktická anotácia MULTEXT
  • porozmýšľať ako využiť korpus "MultextEast" - potrebné vytvoriť mapovanie značiek na SNK Tagset

Poznámka:

Stretnutie: 20.2.2020:

Úlohy na ďalšie stretnutie:

Práca počas semestra

  • naštudovanie Fasttext
  • implementácia do Spacy
  • úprava modelu v spacy na rozpoznanie jazyka
  • snaha o spacy-udpipe pre non-English text

Návrh na zadanie DP

Názov diplomovej práce: Štatistická morfologická anotácia slovenského jazyka

  1. Vypracujte prehľad spôsobov morfologickej anotácie slovenského jazyka.
  2. Pripravte trénovacie dáta vo vhodnom formáte a natrénujte štatistický model morfologického značkovania
  3. Vyhodnoťte presnosť značkovania a navrhnite možné zlepšenia.

Tímový projekt 2019

Projektové stránky:

Spacy tutoriál

  • Vypracovať tutoriál pre prácu s nástrojom Spacy pre úlohu zisťovania gramatických značiek (part-of-speech). Súčasťou tutoriálu by mali byť aj odkazy na relevantné zdroje (odborné članky, min. 4).