2019-12-16 09:46:30 +00:00
# Meno: Jakub Maruniak
2020-01-31 07:57:51 +00:00
*Rok začiatku štúdia*: 2016
2019-11-28 08:54:01 +00:00
2019-12-16 09:46:30 +00:00
## Tímový projekt 2019
2019-11-17 14:30:40 +00:00
2019-12-16 10:00:15 +00:00
#### Anotácia textových dát
2020-01-17 13:47:11 +00:00
2020-01-22 21:10:27 +00:00
*Úlohy tímového projektu*:
2019-12-16 10:00:15 +00:00
- Vypracujte min. 4. stranový rešerš na tému "Crowdsourcing"
- citujte min. 10 najvýznamnejších bibliografických zdrojov
2019-12-16 10:00:27 +00:00
2020-01-22 21:10:45 +00:00
*Písomná práca*: [Rešerš ](./timovy_projekt )
2020-01-22 21:10:27 +00:00
2020-01-23 08:28:20 +00:00
*Návrh na zadanie DP*:
2020-01-31 07:57:51 +00:00
- Vypracujte prehľad metód prípravy textových korpusov pomocou crowdsourcingu.
2020-01-23 08:28:20 +00:00
- Pripravte postup na anotáciu textového korpusu pre systém Prodigy pre trénovanie modelu vo vybranej úlohe spracovania prirodzeného jazyka.
2020-01-31 07:57:51 +00:00
- Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu spracovania prirodzeného jazyka pomocou knižnice Spacy.
- Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosť trénovacej množiny na presnosť klasifikátora.
2020-01-23 08:34:09 +00:00
2020-01-31 07:57:51 +00:00
*Návrh na názov DP*:
Anotácia textových dát v slovenskom jazyku pomocou metódy crowdsourcingu a s využitím knižnice Spacy
2020-01-23 08:34:09 +00:00
2020-01-31 07:57:51 +00:00
*Spolupráca s projektom*:
2020-01-25 16:29:42 +00:00
- [Podpora slovenčiny v Spacy ](/topics/spacy )
2020-01-25 16:26:46 +00:00
- [Anotácia textových dát ](/topics/prodigy )
2020-01-25 16:23:44 +00:00
- [Rozpoznávanie pomenovaných entít ](/topics/named-entity )
2020-01-25 16:25:37 +00:00
- [Spracovanie prir. jazyka ](/topics/nlp )
2020-01-25 16:27:48 +00:00
- [Programovanie v jazyku Python ](/topics/python )