forked from KEMT/zpwiki
		
	Update 'pages/topics/spacy/README.md'
This commit is contained in:
		
							parent
							
								
									ba571b1ef1
								
							
						
					
					
						commit
						f9d5552f8a
					
				| @ -16,13 +16,31 @@ taxonomy: | ||||
|    - pre morfologickú analýzu  | ||||
|    - rozpoznávanie pomenovaných entít | ||||
| - Unifikovaný systém pre predspracovanie slovenského jazyka | ||||
| - Podporiť dialógový systém RASA  | ||||
| - Možné aplikácie: | ||||
|     - Podporiť dialógový systém RASA | ||||
|     - Neurónové vyhľadávanie | ||||
| 
 | ||||
| ## Úlohy | ||||
| ## Hotové úlohy | ||||
| 
 | ||||
| - Zahrnúť transformery a predtrénované modely | ||||
| - Nájsť optimálne hyperparametre | ||||
| - Natrénovať vlastné WordEmbedding (fasttext). | ||||
| - trénovanie modelu Spacy 2, kompletné skripty | ||||
| - trénovanie modelu Spacy 3 do SNK POS tagsetu (ver. 3.0), kompletné skripty | ||||
| - trénovanie modelu Spacy 3 do UD tagsetu (ver. 3.1.), kompletné skripty | ||||
| - zahrnuté slovné vektory Fasttext Common Crawl | ||||
| - Trénovanie Dependency, POS pomocu UD Corpus | ||||
| - Trénovanie NER pomocou automatického korpusu WikiNER (druhý model). | ||||
| 
 | ||||
| ## Budúce úlohy | ||||
| 
 | ||||
| - Zahrnúť predtrénované modely (MultilingualBert, SlovakBert....). | ||||
| - Nájsť optimálne hyperparametre. | ||||
| - Zostaviť korpus pomenovaných entít. | ||||
| - Zaradiť model do oficiálnej distribúcie Explosion AI, podmienka je vlastný korpus pomenovaných entít.  | ||||
| 
 | ||||
| ## Neprioritné úlohy (zásobník) | ||||
| 
 | ||||
| - Zaradiť vlastné WordEmbedding (fasttext). | ||||
| - Pridať lexikálne pravidlá (skratky, stop slová) do oficiálnej distrubúcie Spacy.  | ||||
| - Zaradiť MultextEast do trénovania. Tam je ale potrebné konvertovať tagy do UD.  | ||||
| 
 | ||||
| ## Súvisiace projekty | ||||
| 
 | ||||
|  | ||||
		Loading…
	
		Reference in New Issue
	
	Block a user