From 58ea57eda24b6bd5aeec22aa92d9107ff391d07e Mon Sep 17 00:00:00 2001 From: dano Date: Fri, 7 Feb 2020 09:58:21 +0000 Subject: [PATCH] Update 'pages/students/2016/jakub_maruniak/README.md' --- pages/students/2016/jakub_maruniak/README.md | 11 ++++++----- 1 file changed, 6 insertions(+), 5 deletions(-) diff --git a/pages/students/2016/jakub_maruniak/README.md b/pages/students/2016/jakub_maruniak/README.md index 22631f55..4cfaa6a1 100644 --- a/pages/students/2016/jakub_maruniak/README.md +++ b/pages/students/2016/jakub_maruniak/README.md @@ -12,13 +12,14 @@ *Písomná práca*: [Rešerš](./timovy_projekt) *Návrh na zadanie DP*: -- Vypracujte prehľad metód prípravy textových korpusov pomocou crowdsourcingu. -- Pripravte postup na anotáciu textového korpusu pre systém Prodigy pre trénovanie modelu vo vybranej úlohe spracovania prirodzeného jazyka. -- Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu spracovania prirodzeného jazyka pomocou knižnice Spacy. -- Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosť trénovacej množiny na presnosť klasifikátora. + +1. Vypracujte prehľad metód prípravy textových korpusov pomocou crowdsourcingu. +2. Pripravte postup na anotáciu textového korpusu pre systém Prodigy pre trénovanie modelu vo vybranej úlohe spracovania prirodzeného jazyka. +3. Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu spracovania prirodzeného jazyka pomocou knižnice Spacy. +4. Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosť trénovacej množiny na presnosť klasifikátora. *Návrh na názov DP*: -Anotácia textových dát v slovenskom jazyku pomocou metódy crowdsourcingu a s využitím knižnice Spacy +Anotácia textových dát v slovenskom jazyku pomocou metódy crowdsourcingu *Spolupráca s projektom*: - [Podpora slovenčiny v Spacy](/topics/spacy)