Aktualizovat „pages/students/2016/jakub_maruniak/README.md“

This commit is contained in:
Jakub Maruniak 2020-01-31 07:57:51 +00:00
parent 52eed425af
commit ec36ba213c

View File

@ -1,4 +1,5 @@
# Meno: Jakub Maruniak
*Rok začiatku štúdia*: 2016
## Tímový projekt 2019
@ -11,26 +12,17 @@
*Písomná práca*: [Rešerš](./timovy_projekt)
*Návrh na zadanie DP*:
- Vypravujte prehľad metód prípravy textových korpusov pomocou crowdsourcingu.
- Vypracujte prehľad metód prípravy textových korpusov pomocou crowdsourcingu.
- Pripravte postup na anotáciu textového korpusu pre systém Prodigy pre trénovanie modelu vo vybranej úlohe spracovania prirodzeného jazyka.
- Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu spracovania prirodzeného jazyka pomocu knižnice Spacy.
- Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosč trénovacej množiny na presnosť klasifikátora.
- Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu spracovania prirodzeného jazyka pomocou knižnice Spacy.
- Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosť trénovacej množiny na presnosť klasifikátora.
*Návrh na názov DP*:
Anotácia textových dát v slovenskom jazyku pomocou metódy crowdsourcingu a s využitím knižnice Spacy
*Návrh na názov*:
Anotácia textových dát v slovenskom jazyku
Spolupráca s projektom:
*Spolupráca s projektom*:
- [Podpora slovenčiny v Spacy](/topics/spacy)
- [Anotácia textových dát](/topics/prodigy)
- [Rozpoznávanie pomenovaných entít](/topics/named-entity)
- [Spracovanie prir. jazyka](/topics/nlp)
- [Programovanie v jazyku Python](/topics/python)
#### Anotácia textových dát