forked from KEMT/zpwiki
zz
This commit is contained in:
parent
6d1d0bd62e
commit
ba6599e6a6
@ -14,6 +14,26 @@ Doplnenie podpory morfologického značkovania slovenského jazyka do nlp framew
|
|||||||
- Oboznámte sa so sadou SNK https://korpus.sk/morpho.html
|
- Oboznámte sa so sadou SNK https://korpus.sk/morpho.html
|
||||||
- Natrénovať Spacy Model s POS a s pretrénovaním
|
- Natrénovať Spacy Model s POS a s pretrénovaním
|
||||||
|
|
||||||
|
Stretnutie 12.6.2020:
|
||||||
|
|
||||||
|
- Pretrénovanie Fasttext a trénovanie POS Spacy modelu - ešte treba vylepšiť presnosť
|
||||||
|
|
||||||
|
K zápočtu:
|
||||||
|
|
||||||
|
- Finálny okomentovaný skript pre trénovanie POS modelu podľa Slovak Treebank s pretrénovaním Fasttext.
|
||||||
|
- Ak sa dá tak pri trénovaní využite GPU
|
||||||
|
- Zistite výslednú presnosť, mala by byť nad 80 percent.
|
||||||
|
- Porovnajte s presnosťou bez pretrénovania.
|
||||||
|
|
||||||
|
|
||||||
|
Zásobník úloh:
|
||||||
|
|
||||||
|
- Vykonať viacero experimentov s pretrénovaním - rôzne modely, rôzne veľkosti adaptačných dát a zostaviť tabuľku
|
||||||
|
- Opísať pretrénovanie, zhrnúť vplyv pretrénovania na trénovanie v krátkom článku cca 10 strán.
|
||||||
|
- skúsiť prezentovať na lokálnej konferencii, (Data, Znalosti and WIKT) alebo fakultný zborník (krátka verzia diplomovky).
|
||||||
|
- Využiť korpus Multext East pri trénovaní. Vytvoriť mapovanie Multext Tagov na SNK Tagy.
|
||||||
|
|
||||||
|
|
||||||
Virtuálne stretnutie 15.5.2020:
|
Virtuálne stretnutie 15.5.2020:
|
||||||
|
|
||||||
- Spustenie exitujúceho skriptu pre trénovanie POS modelu z repozitára spacy-skmodel, problém nastal pri NER dátach.
|
- Spustenie exitujúceho skriptu pre trénovanie POS modelu z repozitára spacy-skmodel, problém nastal pri NER dátach.
|
||||||
@ -24,10 +44,6 @@ Nové úlohy:
|
|||||||
- Podrobne preštudovať a realizovať [spacy pretrain](https://spacy.io/api/cli#pretrain)
|
- Podrobne preštudovať a realizovať [spacy pretrain](https://spacy.io/api/cli#pretrain)
|
||||||
- [Blog o Spacy pretrain](https://explosion.ai/blog/spacy-v2-1)
|
- [Blog o Spacy pretrain](https://explosion.ai/blog/spacy-v2-1)
|
||||||
|
|
||||||
Zásobník úloh:
|
|
||||||
|
|
||||||
Využiť korpus Multext East pri trénovaní. Vytvoriť mapovanie Multext Tagov na SNK Tagy.
|
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
Revízia 9.4.2020:
|
Revízia 9.4.2020:
|
||||||
|
Loading…
Reference in New Issue
Block a user