forked from KEMT/zpwiki
29 lines
1.3 KiB
Markdown
29 lines
1.3 KiB
Markdown
# Maroš Harahus
|
|
|
|
## Tímový projekt 2019
|
|
|
|
Projektové stránky:
|
|
|
|
- [Spracovanie prirodzeného jazyka](/topics/nlp)
|
|
- [Python](/topics/python)
|
|
- [Podpora slovenčiny v knižnici Spacy](/topics/spacy)
|
|
|
|
|
|
[Spacy tutoriál](./timovy_projekt)
|
|
|
|
- Vypracovať tutoriál pre prácu s nástrojom Spacy pre úlohu zisťovania gramatických značiek (part-of-speech). Súčasťou tutoriálu by mali byť aj odkazy na relevantné zdroje (odborné članky, min. 4).
|
|
- Návrh na zadanie: Doplnenie podpory morfologického značkovania slovenského jazyka do nlp frameworku (spacy alebo flair)
|
|
- Úloha na ďalší semester:
|
|
- Pozrieť jazykové zdroje z https://www.clarin.eu/resource-families/manually-annotated-corpora (MultextEast)
|
|
- Oboznámte sa so sadou morfologických značiek Universal Dependencies https://universaldependencies.org/sk/index.html
|
|
- Oboznámte sa so sadou SNK https://korpus.sk/morpho.html
|
|
- Vytvoriť mapovanie morfologických značiek SNK na Universal Dependencies
|
|
|
|
## Návrh na zadanie DP
|
|
|
|
Názov diplomovej práce: Štatistická morfologická anotácia slovenského jazyka
|
|
|
|
1. Vypracujte prehľad spôsobov morfologickej anotácie slovenského jazyka.
|
|
2. Pripravte trénovacie dáta vo vhodnom formáte a natrénujte štatistický model morfologického značkovania
|
|
3. Vyhodnoťte presnosť značkovania a navrhnite možné zlepšenia.
|