# Meno: Jakub Maruniak ## Tímový projekt 2019 #### Anotácia textových dát *Úlohy tímového projektu*: - Vypracujte min. 4. stranový rešerš na tému "Crowdsourcing" - citujte min. 10 najvýznamnejších bibliografických zdrojov *Písomná práca*: [Rešerš](./timovy_projekt) *Návrh na zadanie DP*: - Vypravujte prehľad metód prípravy textových korpusov pomocou crowdsourcingu. - Pripravte postup na anotáciu textového korpusu pre systém Prodigy pre trénovanie modelu vo vybranej úlohe spracovania prirodzeného jazyka. - Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu spracovania prirodzeného jazyka pomocu knižnice Spacy. - Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosč trénovacej množiny na presnosť klasifikátora. *Návrh na názov*: Anotácia textových dát v slovenskom jazyku #### Anotácia textových dát