forked from KEMT/zpwiki
		
	Update 'pages/students/2016/jakub_maruniak/README.md'
This commit is contained in:
		
							parent
							
								
									491ae275d2
								
							
						
					
					
						commit
						168f8e0f7c
					
				| @ -8,9 +8,32 @@ taxonomy: | ||||
| --- | ||||
| # Jakub Maruniak | ||||
| 
 | ||||
| 
 | ||||
| *Rok začiatku štúdia*: 2016 | ||||
| 
 | ||||
| 
 | ||||
| *Návrh na názov DP*: | ||||
| 
 | ||||
| Anotácia a rozpoznávanie pomenovaných entít v slovenskom jazyku. | ||||
| 
 | ||||
| *Návrh na zadanie DP*: | ||||
| 
 | ||||
| 1. Vypracujte teoretický úvod, kde vysvetlíte čo je to rozpoznávanie pomenovaných entít a akými najnovšími metódami sa robí. Vysvetlite, ako pracuje klasifikátor pre rozpoznávanie pomenovaných entít v knižnici Spacy.  | ||||
| 2. Pripravte postup na anotáciu textového korpusu pre systém Prodigy pre trénovanie modelu vo vybranej úlohe spracovania prirodzeného jazyka. | ||||
| 3. Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu spracovania prirodzeného jazyka pomocou knižnice Spacy. | ||||
| 4. Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosť trénovacej množiny na presnosť klasifikátora. | ||||
| 
 | ||||
| *Spolupráca s projektom*: | ||||
| 
 | ||||
| - [Podpora slovenčiny v Spacy](/topics/spacy) | ||||
| - [Anotácia textových dát](/topics/prodigy) | ||||
| - [Rozpoznávanie pomenovaných entít](/topics/named-entity) | ||||
| - [Spracovanie prir. jazyka](/topics/nlp) | ||||
| - [Programovanie v jazyku Python](/topics/python) | ||||
| 
 | ||||
| 
 | ||||
| 
 | ||||
| 
 | ||||
| 
 | ||||
| ## Diplomový projekt 2 | ||||
| 
 | ||||
| Ciele: | ||||
| @ -206,21 +229,3 @@ Návrh možných entít na anotáciu: | ||||
| 
 | ||||
| *Písomná práca*: [Rešerš](./timovy_projekt) | ||||
| 
 | ||||
| *Návrh na zadanie DP*: | ||||
| 
 | ||||
| 1. Vypracujte prehľad metód prípravy textových korpusov pomocou crowdsourcingu. | ||||
| 2. Pripravte postup na anotáciu textového korpusu pre systém Prodigy pre trénovanie modelu vo vybranej úlohe spracovania prirodzeného jazyka. | ||||
| 3. Vytvorte množinu textových dát v slovenskom jazyku vhodných na trénovanie štatistického modelu spracovania prirodzeného jazyka pomocou knižnice Spacy. | ||||
| 4. Natrénujte štatistický model pomocou knižnice Spacy a zistite, aký vplyv má veľkosť trénovacej množiny na presnosť klasifikátora. | ||||
| 
 | ||||
| *Návrh na názov DP*: | ||||
| 
 | ||||
| Anotácia textových dát v slovenskom jazyku pomocou metódy crowdsourcingu | ||||
| 
 | ||||
| *Spolupráca s projektom*: | ||||
| 
 | ||||
| - [Podpora slovenčiny v Spacy](/topics/spacy) | ||||
| - [Anotácia textových dát](/topics/prodigy) | ||||
| - [Rozpoznávanie pomenovaných entít](/topics/named-entity) | ||||
| - [Spracovanie prir. jazyka](/topics/nlp) | ||||
| - [Programovanie v jazyku Python](/topics/python) | ||||
|  | ||||
		Loading…
	
		Reference in New Issue
	
	Block a user