# Maroš Harahus ## Tímový projekt 2019 Projektové stránky: - [Spracovanie prirodzeného jazyka](/topics/nlp) - [Python](/topics/python) - [Podpora slovenčiny v knižnici Spacy](/topics/spacy) [Spacy tutoriál](./timovy_projekt) - Vypracovať tutoriál pre prácu s nástrojom Spacy pre úlohu zisťovania gramatických značiek (part-of-speech). Súčasťou tutoriálu by mali byť aj odkazy na relevantné zdroje (odborné članky, min. 4). - Návrh na zadanie: Doplnenie podpory morfologického značkovania slovenského jazyka do nlp frameworku (spacy alebo flair) - Úloha na ďalší semester: - Pozrieť jazykové zdroje z https://www.clarin.eu/resource-families/manually-annotated-corpora (MultextEast) - Oboznámte sa so sadou morfologických značiek Universal Dependencies https://universaldependencies.org/sk/index.html - Oboznámte sa so sadou SNK https://korpus.sk/morpho.html - Vytvoriť mapovanie morfologických značiek SNK na Universal Dependencies ## Návrh na zadanie DP Názov diplomovej práce: Štatistická morfologická anotácia slovenského jazyka 1. Vypracujte prehľad spôsobov morfologickej anotácie slovenského jazyka. 2. Pripravte trénovacie dáta vo vhodnom formáte a natrénujte štatistický model morfologického značkovania 3. Vyhodnoťte presnosť značkovania a navrhnite možné zlepšenia.