forked from KEMT/zpwiki
		
	stretko
This commit is contained in:
		
							parent
							
								
									355cc2f33b
								
							
						
					
					
						commit
						dd21dc5c9e
					
				@ -12,8 +12,23 @@ Doplnenie podpory morfologického značkovania slovenského jazyka do nlp framew
 | 
			
		||||
    - Pozrieť jazykové zdroje z https://www.clarin.eu/resource-families/manually-annotated-corpora  (MultextEast)
 | 
			
		||||
    - Oboznámte sa so sadou morfologických značiek Universal Dependencies https://universaldependencies.org/sk/index.html
 | 
			
		||||
    - Oboznámte sa so sadou SNK https://korpus.sk/morpho.html
 | 
			
		||||
    - Vytvoriť mapovanie morfologických značiek SNK na Universal Dependencies
 | 
			
		||||
    - Natrénovať Spacy Model 
 | 
			
		||||
    - Natrénovať Spacy Model s POS a s pretrénovaním
 | 
			
		||||
 | 
			
		||||
Stretnutie 5.3.2020:
 | 
			
		||||
 | 
			
		||||
Úlohy na ďalšie stretnutie:
 | 
			
		||||
 | 
			
		||||
- zobrať alebo vytvoriť fasttext model
 | 
			
		||||
- pozrieť sa na [spacy pretrain](https://spacy.io/api/cli) - tam sa bude dať využiť fasttext model
 | 
			
		||||
- vložiť ho do spacy modelu pomocou `spacy pretrain`
 | 
			
		||||
- pozrieť si http://nl.ijs.si/ME/V4/ morfosyntaktická anotácia MULTEXT
 | 
			
		||||
- porozmýšľať ako využiť korpus "MultextEast" - potrebné vytvoriť mapovanie značiek na SNK Tagset
 | 
			
		||||
 | 
			
		||||
Poznámka:
 | 
			
		||||
 | 
			
		||||
- Aktivovaná Omega
 | 
			
		||||
- Pozrieť sa na https://git.kemt.fei.tuke.sk/dano/spacy-skmodel/src/branch/master/sources/slovak-treebank , aktivovaný prístup
 | 
			
		||||
- už existuje mapovanie [Universal Dependencie na SNK tagset](https://github.com/explosion/spaCy/blob/master/spacy/lang/sk/tag_map.py)
 | 
			
		||||
 | 
			
		||||
 | 
			
		||||
Stretnutie: 20.2.2020:
 | 
			
		||||
 | 
			
		||||
		Loading…
	
		Reference in New Issue
	
	Block a user