forked from KEMT/zpwiki
Update 'pages/students/2016/jakub_maruniak/README.md'
This commit is contained in:
parent
ae4ce840e4
commit
58ea57eda2
@ -12,13 +12,14 @@
|
||||
*Písomná práca*: [Rešerš](./timovy_projekt)
|
||||
|
||||
*Návrh na zadanie DP*:
|
||||
- Vypracujte prehľad metód prípravy textových korpusov pomocou crowdsourcingu.
|
||||
- Pripravte postup na anotáciu textového korpusu pre systém Prodigy pre trénovanie modelu vo vybranej úlohe spracovania prirodzeného jazyka.
|
||||
- Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu spracovania prirodzeného jazyka pomocou knižnice Spacy.
|
||||
- Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosť trénovacej množiny na presnosť klasifikátora.
|
||||
|
||||
1. Vypracujte prehľad metód prípravy textových korpusov pomocou crowdsourcingu.
|
||||
2. Pripravte postup na anotáciu textového korpusu pre systém Prodigy pre trénovanie modelu vo vybranej úlohe spracovania prirodzeného jazyka.
|
||||
3. Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu spracovania prirodzeného jazyka pomocou knižnice Spacy.
|
||||
4. Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosť trénovacej množiny na presnosť klasifikátora.
|
||||
|
||||
*Návrh na názov DP*:
|
||||
Anotácia textových dát v slovenskom jazyku pomocou metódy crowdsourcingu a s využitím knižnice Spacy
|
||||
Anotácia textových dát v slovenskom jazyku pomocou metódy crowdsourcingu
|
||||
|
||||
*Spolupráca s projektom*:
|
||||
- [Podpora slovenčiny v Spacy](/topics/spacy)
|
||||
|
Loading…
Reference in New Issue
Block a user