Update 'pages/students/2016/jakub_maruniak/README.md'

This commit is contained in:
dano 2020-02-07 09:58:21 +00:00
parent ae4ce840e4
commit 58ea57eda2

View File

@ -12,13 +12,14 @@
*Písomná práca*: [Rešerš](./timovy_projekt) *Písomná práca*: [Rešerš](./timovy_projekt)
*Návrh na zadanie DP*: *Návrh na zadanie DP*:
- Vypracujte prehľad metód prípravy textových korpusov pomocou crowdsourcingu.
- Pripravte postup na anotáciu textového korpusu pre systém Prodigy pre trénovanie modelu vo vybranej úlohe spracovania prirodzeného jazyka. 1. Vypracujte prehľad metód prípravy textových korpusov pomocou crowdsourcingu.
- Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu spracovania prirodzeného jazyka pomocou knižnice Spacy. 2. Pripravte postup na anotáciu textového korpusu pre systém Prodigy pre trénovanie modelu vo vybranej úlohe spracovania prirodzeného jazyka.
- Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosť trénovacej množiny na presnosť klasifikátora. 3. Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu spracovania prirodzeného jazyka pomocou knižnice Spacy.
4. Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosť trénovacej množiny na presnosť klasifikátora.
*Návrh na názov DP*: *Návrh na názov DP*:
Anotácia textových dát v slovenskom jazyku pomocou metódy crowdsourcingu a s využitím knižnice Spacy Anotácia textových dát v slovenskom jazyku pomocou metódy crowdsourcingu
*Spolupráca s projektom*: *Spolupráca s projektom*:
- [Podpora slovenčiny v Spacy](/topics/spacy) - [Podpora slovenčiny v Spacy](/topics/spacy)