forked from KEMT/zpwiki
Update 'pages/students/2016/jakub_maruniak/README.md'
This commit is contained in:
parent
491ae275d2
commit
168f8e0f7c
@ -8,9 +8,32 @@ taxonomy:
|
|||||||
---
|
---
|
||||||
# Jakub Maruniak
|
# Jakub Maruniak
|
||||||
|
|
||||||
|
|
||||||
*Rok začiatku štúdia*: 2016
|
*Rok začiatku štúdia*: 2016
|
||||||
|
|
||||||
|
|
||||||
|
*Návrh na názov DP*:
|
||||||
|
|
||||||
|
Anotácia a rozpoznávanie pomenovaných entít v slovenskom jazyku.
|
||||||
|
|
||||||
|
*Návrh na zadanie DP*:
|
||||||
|
|
||||||
|
1. Vypracujte teoretický úvod, kde vysvetlíte čo je to rozpoznávanie pomenovaných entít a akými najnovšími metódami sa robí. Vysvetlite, ako pracuje klasifikátor pre rozpoznávanie pomenovaných entít v knižnici Spacy.
|
||||||
|
2. Pripravte postup na anotáciu textového korpusu pre systém Prodigy pre trénovanie modelu vo vybranej úlohe spracovania prirodzeného jazyka.
|
||||||
|
3. Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu spracovania prirodzeného jazyka pomocou knižnice Spacy.
|
||||||
|
4. Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosť trénovacej množiny na presnosť klasifikátora.
|
||||||
|
|
||||||
|
*Spolupráca s projektom*:
|
||||||
|
|
||||||
|
- [Podpora slovenčiny v Spacy](/topics/spacy)
|
||||||
|
- [Anotácia textových dát](/topics/prodigy)
|
||||||
|
- [Rozpoznávanie pomenovaných entít](/topics/named-entity)
|
||||||
|
- [Spracovanie prir. jazyka](/topics/nlp)
|
||||||
|
- [Programovanie v jazyku Python](/topics/python)
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
## Diplomový projekt 2
|
## Diplomový projekt 2
|
||||||
|
|
||||||
Ciele:
|
Ciele:
|
||||||
@ -206,21 +229,3 @@ Návrh možných entít na anotáciu:
|
|||||||
|
|
||||||
*Písomná práca*: [Rešerš](./timovy_projekt)
|
*Písomná práca*: [Rešerš](./timovy_projekt)
|
||||||
|
|
||||||
*Návrh na zadanie DP*:
|
|
||||||
|
|
||||||
1. Vypracujte prehľad metód prípravy textových korpusov pomocou crowdsourcingu.
|
|
||||||
2. Pripravte postup na anotáciu textového korpusu pre systém Prodigy pre trénovanie modelu vo vybranej úlohe spracovania prirodzeného jazyka.
|
|
||||||
3. Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu spracovania prirodzeného jazyka pomocou knižnice Spacy.
|
|
||||||
4. Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosť trénovacej množiny na presnosť klasifikátora.
|
|
||||||
|
|
||||||
*Návrh na názov DP*:
|
|
||||||
|
|
||||||
Anotácia textových dát v slovenskom jazyku pomocou metódy crowdsourcingu
|
|
||||||
|
|
||||||
*Spolupráca s projektom*:
|
|
||||||
|
|
||||||
- [Podpora slovenčiny v Spacy](/topics/spacy)
|
|
||||||
- [Anotácia textových dát](/topics/prodigy)
|
|
||||||
- [Rozpoznávanie pomenovaných entít](/topics/named-entity)
|
|
||||||
- [Spracovanie prir. jazyka](/topics/nlp)
|
|
||||||
- [Programovanie v jazyku Python](/topics/python)
|
|
||||||
|
Loading…
Reference in New Issue
Block a user