forked from KEMT/zpwiki
stretko
This commit is contained in:
parent
355cc2f33b
commit
dd21dc5c9e
@ -12,8 +12,23 @@ Doplnenie podpory morfologického značkovania slovenského jazyka do nlp framew
|
||||
- Pozrieť jazykové zdroje z https://www.clarin.eu/resource-families/manually-annotated-corpora (MultextEast)
|
||||
- Oboznámte sa so sadou morfologických značiek Universal Dependencies https://universaldependencies.org/sk/index.html
|
||||
- Oboznámte sa so sadou SNK https://korpus.sk/morpho.html
|
||||
- Vytvoriť mapovanie morfologických značiek SNK na Universal Dependencies
|
||||
- Natrénovať Spacy Model
|
||||
- Natrénovať Spacy Model s POS a s pretrénovaním
|
||||
|
||||
Stretnutie 5.3.2020:
|
||||
|
||||
Úlohy na ďalšie stretnutie:
|
||||
|
||||
- zobrať alebo vytvoriť fasttext model
|
||||
- pozrieť sa na [spacy pretrain](https://spacy.io/api/cli) - tam sa bude dať využiť fasttext model
|
||||
- vložiť ho do spacy modelu pomocou `spacy pretrain`
|
||||
- pozrieť si http://nl.ijs.si/ME/V4/ morfosyntaktická anotácia MULTEXT
|
||||
- porozmýšľať ako využiť korpus "MultextEast" - potrebné vytvoriť mapovanie značiek na SNK Tagset
|
||||
|
||||
Poznámka:
|
||||
|
||||
- Aktivovaná Omega
|
||||
- Pozrieť sa na https://git.kemt.fei.tuke.sk/dano/spacy-skmodel/src/branch/master/sources/slovak-treebank , aktivovaný prístup
|
||||
- už existuje mapovanie [Universal Dependencie na SNK tagset](https://github.com/explosion/spaCy/blob/master/spacy/lang/sk/tag_map.py)
|
||||
|
||||
|
||||
Stretnutie: 20.2.2020:
|
||||
|
Loading…
Reference in New Issue
Block a user