diff --git a/pages/students/2016/jakub_maruniak/README.md b/pages/students/2016/jakub_maruniak/README.md index cb0ec2ea..13dc746c 100644 --- a/pages/students/2016/jakub_maruniak/README.md +++ b/pages/students/2016/jakub_maruniak/README.md @@ -10,11 +10,13 @@ *Písomná práca*: [Rešerš](./timovy_projekt) -*Návrh na zadanie*: -- ... -- Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu -- Natrénujte štatistický model pomocou knižnice Spacy -- Vyhodnotiť výsledky ??? +*Návrh na zadanie DP*: + +- Vypravujte prehľad metód prípravy textových korpusov pomocou crowdsourcingu. +- Pripravte postup na anotáciu textového korpusu pre systém Prodigy pre trénovanie modelu vo vybranej úlohe spracovania prirodzeného jazyka. +- Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu spracovania prirodzeného jazyka pomocu knižnice Spacy. +- Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosč trénovacej množiny na presnosť klasifikátora. + *Návrh na názov*: Anotácia textových dát v slovenskom jazyku