| .. | ||
| timovy_projekt | ||
| README.md | ||
Maroš Harahus
Tímový projekt 2019
- Vypracovať tutoriál pre prácu s nástrojom Spacy pre úlohu zisťovania gramatických značiek (part-of-speech). Súčasťou tutoriálu by mali byť aj odkazy na relevantné zdroje (odborné članky, min. 4).
 - Návrh na zadanie: Doplnenie podpory morfologického značkovania slovenského jazyka do nlp frameworku (spacy alebo flair)
 - Úloha na ďalší semester:
- Pozrieť jazykové zdroje z https://www.clarin.eu/resource-families/manually-annotated-corpora (MultextEast)
 - Oboznámte sa so sadou morfologických značiek Universal Dependencies https://universaldependencies.org/sk/index.html
 - Oboznámte sa so sadou SNK https://korpus.sk/morpho.html
 - Vytvoriť mapovanie morfologických značiek SNK na Universal Dependencies
 
 
Návrh na zadanie DP
- Vypracujte prehľad spôsobov morfologickej anotácie slovenského jazyka.
 - Pripravte trénovacie dáta vo vhodnom formáte a natrénujte štatistický model morfologického značkovania
 - Vyhodnotte presnosť značkovania a navrhnite možné zlepšenia.