dmytro_ushatenko/pages/students/2016/jakub_maruniak/README.md

1.3 KiB

Meno: Jakub Maruniak

Tímový projekt 2019

Anotácia textových dát

Úlohy tímového projektu:

  • Vypracujte min. 4. stranový rešerš na tému "Crowdsourcing"
  • citujte min. 10 najvýznamnejších bibliografických zdrojov

Písomná práca: Rešerš

Návrh na zadanie DP:

  • Vypravujte prehľad metód prípravy textových korpusov pomocou crowdsourcingu.
  • Pripravte postup na anotáciu textového korpusu pre systém Prodigy pre trénovanie modelu vo vybranej úlohe spracovania prirodzeného jazyka.
  • Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu spracovania prirodzeného jazyka pomocu knižnice Spacy.
  • Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosč trénovacej množiny na presnosť klasifikátora.

Návrh na názov:

Anotácia textových dát v slovenskom jazyku

Spolupráca s projektom:

Anotácia textových dát