| .. | ||
| timovy_projekt | ||
| README.md | ||
Meno: Jakub Maruniak
Tímový projekt 2019
Anotácia textových dát
Úlohy tímového projektu:
- Vypracujte min. 4. stranový rešerš na tému "Crowdsourcing"
 - citujte min. 10 najvýznamnejších bibliografických zdrojov
 
Písomná práca: Rešerš
Návrh na zadanie DP:
- Vypravujte prehľad metód prípravy textových korpusov pomocou crowdsourcingu.
 - Pripravte postup na anotáciu textového korpusu pre systém Prodigy pre trénovanie modelu vo vybranej úlohe spracovania prirodzeného jazyka.
 - Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu spracovania prirodzeného jazyka pomocu knižnice Spacy.
 - Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosč trénovacej množiny na presnosť klasifikátora.
 
Návrh na názov: Anotácia textových dát v slovenskom jazyku