From 39dc69c86c99aeb11bf7de8bc63d0bd8572dc829 Mon Sep 17 00:00:00 2001 From: dano Date: Thu, 23 Jan 2020 08:28:20 +0000 Subject: [PATCH] Update 'pages/students/2016/jakub_maruniak/README.md' --- pages/students/2016/jakub_maruniak/README.md | 12 +++++++----- 1 file changed, 7 insertions(+), 5 deletions(-) diff --git a/pages/students/2016/jakub_maruniak/README.md b/pages/students/2016/jakub_maruniak/README.md index cb0ec2ea29..13dc746c74 100644 --- a/pages/students/2016/jakub_maruniak/README.md +++ b/pages/students/2016/jakub_maruniak/README.md @@ -10,11 +10,13 @@ *Písomná práca*: [Rešerš](./timovy_projekt) -*Návrh na zadanie*: -- ... -- Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu -- Natrénujte štatistický model pomocou knižnice Spacy -- Vyhodnotiť výsledky ??? +*Návrh na zadanie DP*: + +- Vypravujte prehľad metód prípravy textových korpusov pomocou crowdsourcingu. +- Pripravte postup na anotáciu textového korpusu pre systém Prodigy pre trénovanie modelu vo vybranej úlohe spracovania prirodzeného jazyka. +- Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu spracovania prirodzeného jazyka pomocu knižnice Spacy. +- Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosč trénovacej množiny na presnosť klasifikátora. + *Návrh na názov*: Anotácia textových dát v slovenskom jazyku