dmytro_ushatenko/pages/students/2016/jakub_maruniak
2020-01-25 17:29:42 +01:00
..
timovy_projekt Aktualizovat "pages/students/2016/jakub_maruniak/timovy_projekt/README.md 2019-12-16 09:54:20 +00:00
README.md moved spacy 2020-01-25 17:29:42 +01:00

Meno: Jakub Maruniak

Tímový projekt 2019

Anotácia textových dát

Úlohy tímového projektu:

  • Vypracujte min. 4. stranový rešerš na tému "Crowdsourcing"
  • citujte min. 10 najvýznamnejších bibliografických zdrojov

Písomná práca: Rešerš

Návrh na zadanie DP:

  • Vypravujte prehľad metód prípravy textových korpusov pomocou crowdsourcingu.
  • Pripravte postup na anotáciu textového korpusu pre systém Prodigy pre trénovanie modelu vo vybranej úlohe spracovania prirodzeného jazyka.
  • Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu spracovania prirodzeného jazyka pomocu knižnice Spacy.
  • Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosč trénovacej množiny na presnosť klasifikátora.

Návrh na názov:

Anotácia textových dát v slovenskom jazyku

Spolupráca s projektom:

Anotácia textových dát