forked from KEMT/zpwiki
		
	Update 'pages/students/2016/maros_harahus/README.md'
This commit is contained in:
		
							parent
							
								
									68a76afc81
								
							
						
					
					
						commit
						b3dd748e0e
					
				| @ -1,4 +1,35 @@ | |||||||
| # Maroš Harahus | # Maroš Harahus | ||||||
|  | ## Diplomový projekt 2020 | ||||||
|  | 
 | ||||||
|  | 
 | ||||||
|  | Doplnenie podpory morfologického značkovania slovenského jazyka do nlp frameworku (spacy alebo flair)  | ||||||
|  | 
 | ||||||
|  | - Úlohy na tento semester:  | ||||||
|  |     - Pozrieť jazykové zdroje z https://www.clarin.eu/resource-families/manually-annotated-corpora  (MultextEast) | ||||||
|  |     - Oboznámte sa so sadou morfologických značiek Universal Dependencies https://universaldependencies.org/sk/index.html | ||||||
|  |     - Oboznámte sa so sadou SNK https://korpus.sk/morpho.html | ||||||
|  |     - Vytvoriť mapovanie morfologických značiek SNK na Universal Dependencies | ||||||
|  |     - Natrénovať Spacy Model  | ||||||
|  | 
 | ||||||
|  | Stretnutie: 20.2.2020: | ||||||
|  | 
 | ||||||
|  | Úlohy na ďalšie stretnutie: | ||||||
|  | 
 | ||||||
|  | - Pozrieť https://spacy.io/usage/training#tagger-parser | ||||||
|  | - Pozrieť si čo je word embedding - word2vec, fasttext, glove | ||||||
|  | - Nájsť spôsob ako využiť existujúci model word embedding pri trénovaní https://fasttext.cc/docs/en/pretrained-vectors.html | ||||||
|  | - Ako natrénovať Spacy POS model? | ||||||
|  | 
 | ||||||
|  | 
 | ||||||
|  | 
 | ||||||
|  | ## Návrh na zadanie DP | ||||||
|  | 
 | ||||||
|  | Názov diplomovej práce: Štatistická morfologická anotácia slovenského jazyka | ||||||
|  | 
 | ||||||
|  | 1. Vypracujte  prehľad spôsobov morfologickej anotácie slovenského jazyka. | ||||||
|  | 2. Pripravte trénovacie dáta vo vhodnom formáte a natrénujte štatistický model morfologického značkovania | ||||||
|  | 3. Vyhodnoťte presnosť značkovania a navrhnite možné zlepšenia. | ||||||
|  | 
 | ||||||
| 
 | 
 | ||||||
| ## Tímový projekt 2019 | ## Tímový projekt 2019 | ||||||
| 
 | 
 | ||||||
| @ -12,17 +43,3 @@ Projektové stránky: | |||||||
| [Spacy tutoriál](./timovy_projekt) | [Spacy tutoriál](./timovy_projekt) | ||||||
| 
 | 
 | ||||||
| - Vypracovať tutoriál pre prácu s nástrojom Spacy pre úlohu zisťovania gramatických značiek (part-of-speech). Súčasťou tutoriálu by mali byť aj odkazy na relevantné zdroje (odborné članky, min. 4). | - Vypracovať tutoriál pre prácu s nástrojom Spacy pre úlohu zisťovania gramatických značiek (part-of-speech). Súčasťou tutoriálu by mali byť aj odkazy na relevantné zdroje (odborné članky, min. 4). | ||||||
| - Návrh na zadanie: Doplnenie podpory morfologického značkovania slovenského jazyka do nlp frameworku (spacy alebo flair)  |  | ||||||
| - Úloha na ďalší semester:  |  | ||||||
|     - Pozrieť jazykové zdroje z https://www.clarin.eu/resource-families/manually-annotated-corpora  (MultextEast) |  | ||||||
|     - Oboznámte sa so sadou morfologických značiek Universal Dependencies https://universaldependencies.org/sk/index.html |  | ||||||
|     - Oboznámte sa so sadou SNK https://korpus.sk/morpho.html |  | ||||||
|     - Vytvoriť mapovanie morfologických značiek SNK na Universal Dependencies |  | ||||||
| 
 |  | ||||||
| ## Návrh na zadanie DP |  | ||||||
| 
 |  | ||||||
| Názov diplomovej práce: Štatistická morfologická anotácia slovenského jazyka |  | ||||||
| 
 |  | ||||||
| 1. Vypracujte  prehľad spôsobov morfologickej anotácie slovenského jazyka. |  | ||||||
| 2. Pripravte trénovacie dáta vo vhodnom formáte a natrénujte štatistický model morfologického značkovania |  | ||||||
| 3. Vyhodnoťte presnosť značkovania a navrhnite možné zlepšenia. |  | ||||||
|  | |||||||
		Loading…
	
		Reference in New Issue
	
	Block a user