forked from KEMT/zpwiki
		
	Update 'pages/topics/spacy/README.md'
This commit is contained in:
		
							parent
							
								
									ba571b1ef1
								
							
						
					
					
						commit
						f9d5552f8a
					
				@ -16,13 +16,31 @@ taxonomy:
 | 
				
			|||||||
   - pre morfologickú analýzu 
 | 
					   - pre morfologickú analýzu 
 | 
				
			||||||
   - rozpoznávanie pomenovaných entít
 | 
					   - rozpoznávanie pomenovaných entít
 | 
				
			||||||
- Unifikovaný systém pre predspracovanie slovenského jazyka
 | 
					- Unifikovaný systém pre predspracovanie slovenského jazyka
 | 
				
			||||||
 | 
					- Možné aplikácie:
 | 
				
			||||||
    - Podporiť dialógový systém RASA
 | 
					    - Podporiť dialógový systém RASA
 | 
				
			||||||
 | 
					    - Neurónové vyhľadávanie
 | 
				
			||||||
 | 
					
 | 
				
			||||||
## Úlohy
 | 
					## Hotové úlohy
 | 
				
			||||||
 | 
					
 | 
				
			||||||
- Zahrnúť transformery a predtrénované modely
 | 
					- trénovanie modelu Spacy 2, kompletné skripty
 | 
				
			||||||
- Nájsť optimálne hyperparametre
 | 
					- trénovanie modelu Spacy 3 do SNK POS tagsetu (ver. 3.0), kompletné skripty
 | 
				
			||||||
- Natrénovať vlastné WordEmbedding (fasttext).
 | 
					- trénovanie modelu Spacy 3 do UD tagsetu (ver. 3.1.), kompletné skripty
 | 
				
			||||||
 | 
					- zahrnuté slovné vektory Fasttext Common Crawl
 | 
				
			||||||
 | 
					- Trénovanie Dependency, POS pomocu UD Corpus
 | 
				
			||||||
 | 
					- Trénovanie NER pomocou automatického korpusu WikiNER (druhý model).
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					## Budúce úlohy
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					- Zahrnúť predtrénované modely (MultilingualBert, SlovakBert....).
 | 
				
			||||||
 | 
					- Nájsť optimálne hyperparametre.
 | 
				
			||||||
 | 
					- Zostaviť korpus pomenovaných entít.
 | 
				
			||||||
 | 
					- Zaradiť model do oficiálnej distribúcie Explosion AI, podmienka je vlastný korpus pomenovaných entít. 
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					## Neprioritné úlohy (zásobník)
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
					- Zaradiť vlastné WordEmbedding (fasttext).
 | 
				
			||||||
 | 
					- Pridať lexikálne pravidlá (skratky, stop slová) do oficiálnej distrubúcie Spacy. 
 | 
				
			||||||
 | 
					- Zaradiť MultextEast do trénovania. Tam je ale potrebné konvertovať tagy do UD. 
 | 
				
			||||||
 | 
					
 | 
				
			||||||
## Súvisiace projekty
 | 
					## Súvisiace projekty
 | 
				
			||||||
 | 
					
 | 
				
			||||||
 | 
				
			|||||||
		Loading…
	
		Reference in New Issue
	
	Block a user