From 518f54714e09ab13d5c16e9103266c0021b70f1f Mon Sep 17 00:00:00 2001 From: dano Date: Thu, 5 Dec 2019 08:58:21 +0000 Subject: [PATCH] Update 'pages/teachers/hladek/subjects/dp2021/README.md' --- pages/teachers/hladek/subjects/dp2021/README.md | 13 ++++++++++++- 1 file changed, 12 insertions(+), 1 deletion(-) diff --git a/pages/teachers/hladek/subjects/dp2021/README.md b/pages/teachers/hladek/subjects/dp2021/README.md index 2c8fb675a..df7062cf3 100644 --- a/pages/teachers/hladek/subjects/dp2021/README.md +++ b/pages/teachers/hladek/subjects/dp2021/README.md @@ -86,11 +86,22 @@ Dátumy stretnutí: - 14.11 - Lindvai, Harahus, Holp - 21.11 - Lindvai - 28.11 - Harahus, Holp +- 5.12. - Harahus Maroš Harahus - Vypracovať tutoriál pre prácu s nástrojom Spacy pre úlohu zisťovania gramatických značiek (part-of-speech). Súčasťou tutoriálu by mali byť aj odkazy na relevantné zdroje (odborné članky, min. 4). -- Návrh na zadanie: Doplnenie podpory slovenského jazyka do nlp frameworku (spacy alebo flair) +- Návrh na zadanie: Doplnenie podpory morfologického značkovania slovenského jazyka do nlp frameworku (spacy alebo flair) +- Úloha na ďalší semester: + - Pozrieť jazykové zdroje z https://www.clarin.eu/resource-families/manually-annotated-corpora (MultextEast) + - Oboznámte sa so sadou morfologických značiek Universal Dependencies https://universaldependencies.org/sk/index.html + - Oboznámte sa so sadou SNK https://korpus.sk/morpho.html + - Vytvoriť mapovanie morfologických značiek SNK na Universal Dependencies + +Návrh na zadanie DP: +- Vypracujte prehľad spôsobov morfologickej anotácie slovenského jazyka. +- Pripravte trénovacie dáta vo vhodnom formáte a natrénujte štatistický model morfologického značkovania +- Vyhodnotte presnosť značkovania a navrhnite možné zlepšenia. Dárius Lindvai