# Meno: Jakub Maruniak ## Tímový projekt 2019 #### Anotácia textových dát *Úlohy tímového projektu*: - Vypracujte min. 4. stranový rešerš na tému "Crowdsourcing" - citujte min. 10 najvýznamnejších bibliografických zdrojov *Písomná práca*: [Rešerš](./timovy_projekt) *Návrh na zadanie DP*: - Vypravujte prehľad metód prípravy textových korpusov pomocou crowdsourcingu. - Pripravte postup na anotáciu textového korpusu pre systém Prodigy pre trénovanie modelu vo vybranej úlohe spracovania prirodzeného jazyka. - Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu spracovania prirodzeného jazyka pomocu knižnice Spacy. - Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosč trénovacej množiny na presnosť klasifikátora. *Návrh na názov*: Anotácia textových dát v slovenskom jazyku Spolupráca s projektom: - [Podpora slovenčiny v Spacy](../../../teachers/hladek/topics/spacy) - [Anotácia textových dát](/topics/prodigy) - [Rozpoznávanie pomenovaných entít](/topics/named-entity) - [Spracovanie prir. jazyka](/topics/nlp) - [Programovanie v jazyku Python](/topics/python) #### Anotácia textových dát