dmytro_ushatenko/pages/students/2016/jakub_maruniak/README.md

37 lines
1.3 KiB
Markdown

# Meno: Jakub Maruniak
## Tímový projekt 2019
#### Anotácia textových dát
*Úlohy tímového projektu*:
- Vypracujte min. 4. stranový rešerš na tému "Crowdsourcing"
- citujte min. 10 najvýznamnejších bibliografických zdrojov
*Písomná práca*: [Rešerš](./timovy_projekt)
*Návrh na zadanie DP*:
- Vypravujte prehľad metód prípravy textových korpusov pomocou crowdsourcingu.
- Pripravte postup na anotáciu textového korpusu pre systém Prodigy pre trénovanie modelu vo vybranej úlohe spracovania prirodzeného jazyka.
- Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu spracovania prirodzeného jazyka pomocu knižnice Spacy.
- Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosč trénovacej množiny na presnosť klasifikátora.
*Návrh na názov*:
Anotácia textových dát v slovenskom jazyku
Spolupráca s projektom:
- [Podpora slovenčiny v Spacy](../../../teachers/hladek/topics/spacy)
- [Anotácia textových dát](../../../teachers/hladek/topics/prodigy)
- [Rozpoznávanie pomenovaných entít](../../../teachers/hladek/topics/named-entity)
- [Spracovanie prir. jazyka](../../../teachers/hladek/topics/nlp)
- [Programovanie v jazyku Python](../../../teachers/hladek/topics/python)
#### Anotácia textových dát