diff --git a/pages/students/2016/jakub_maruniak/README.md b/pages/students/2016/jakub_maruniak/README.md index 98b6a7e3c..a3c91610f 100644 --- a/pages/students/2016/jakub_maruniak/README.md +++ b/pages/students/2016/jakub_maruniak/README.md @@ -1,4 +1,5 @@ # Meno: Jakub Maruniak +*Rok začiatku štúdia*: 2016 ## Tímový projekt 2019 @@ -11,26 +12,17 @@ *Písomná práca*: [Rešerš](./timovy_projekt) *Návrh na zadanie DP*: - -- Vypravujte prehľad metód prípravy textových korpusov pomocou crowdsourcingu. +- Vypracujte prehľad metód prípravy textových korpusov pomocou crowdsourcingu. - Pripravte postup na anotáciu textového korpusu pre systém Prodigy pre trénovanie modelu vo vybranej úlohe spracovania prirodzeného jazyka. -- Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu spracovania prirodzeného jazyka pomocu knižnice Spacy. -- Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosč trénovacej množiny na presnosť klasifikátora. +- Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu spracovania prirodzeného jazyka pomocou knižnice Spacy. +- Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosť trénovacej množiny na presnosť klasifikátora. +*Návrh na názov DP*: +Anotácia textových dát v slovenskom jazyku pomocou metódy crowdsourcingu a s využitím knižnice Spacy -*Návrh na názov*: - -Anotácia textových dát v slovenskom jazyku - -Spolupráca s projektom: - +*Spolupráca s projektom*: - [Podpora slovenčiny v Spacy](/topics/spacy) - [Anotácia textových dát](/topics/prodigy) - [Rozpoznávanie pomenovaných entít](/topics/named-entity) - [Spracovanie prir. jazyka](/topics/nlp) - [Programovanie v jazyku Python](/topics/python) - - -#### Anotácia textových dát - -