History

Daniel Hladek f9104754e6 zz		2020-03-09 11:38:01 +01:00
..
timovy_projekt	Aktualizovat "pages/students/2016/jakub_maruniak/timovy_projekt/README.md	2019-12-16 09:54:20 +00:00
README.md	zz	2020-03-09 11:38:01 +01:00

Jakub Maruniak

Rok začiatku štúdia: 2016

Diplomový projekt 1 2020

Úlohy na semester:

Stretnutie 9.3.2020:

Úlohy na ďalšie stretnutie:

Oboznámte sa s so systémom Docker
Rozbehajte si anotáciu z repozitára
Skúste upraviť proces tak aby bol vhodný na anotáciu slovenských pomenovaných entít

Návrh možných entít na anotáciu:

Úlohy tímového projektu:

Písomná práca: Rešerš

Návrh na zadanie DP:

Vypracujte prehľad metód prípravy textových korpusov pomocou crowdsourcingu.
Pripravte postup na anotáciu textového korpusu pre systém Prodigy pre trénovanie modelu vo vybranej úlohe spracovania prirodzeného jazyka.
Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu spracovania prirodzeného jazyka pomocou knižnice Spacy.
Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosť trénovacej množiny na presnosť klasifikátora.

Návrh na názov DP:

Anotácia textových dát v slovenskom jazyku pomocou metódy crowdsourcingu

Spolupráca s projektom: