dmytro_ushatenko/pages/students/2016/jakub_maruniak
2020-01-31 07:57:51 +00:00
..
timovy_projekt Aktualizovat "pages/students/2016/jakub_maruniak/timovy_projekt/README.md 2019-12-16 09:54:20 +00:00
README.md Aktualizovat „pages/students/2016/jakub_maruniak/README.md“ 2020-01-31 07:57:51 +00:00

Meno: Jakub Maruniak

Rok začiatku štúdia: 2016

Tímový projekt 2019

Anotácia textových dát

Úlohy tímového projektu:

  • Vypracujte min. 4. stranový rešerš na tému "Crowdsourcing"
  • citujte min. 10 najvýznamnejších bibliografických zdrojov

Písomná práca: Rešerš

Návrh na zadanie DP:

  • Vypracujte prehľad metód prípravy textových korpusov pomocou crowdsourcingu.
  • Pripravte postup na anotáciu textového korpusu pre systém Prodigy pre trénovanie modelu vo vybranej úlohe spracovania prirodzeného jazyka.
  • Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu spracovania prirodzeného jazyka pomocou knižnice Spacy.
  • Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosť trénovacej množiny na presnosť klasifikátora.

Návrh na názov DP: Anotácia textových dát v slovenskom jazyku pomocou metódy crowdsourcingu a s využitím knižnice Spacy

Spolupráca s projektom: