Update 'pages/topics/spacy/sREADME.md'

This commit is contained in:
dano 2021-12-02 14:45:30 +00:00
parent 4a2a3e6023
commit bdfb6c3aec

View File

@ -9,18 +9,29 @@ taxonomy:
[Trénovanie modelov Spacy](https://spacy.io/usage/training)
## Úlohy
## Ciele
- Vytvoriť modul v jazyku Python pre podporu slovenčiny
- Pripraviť trénovacie dáta pomocu frameworku [Prodigy](/topics/prodigy).
- Natrénovať štatistické modely:
- pre morfologickú analýzu
- rozpoznávanie pomenovaných entít
- Unifikovaný systém pre predspracovanie slovenského jazyka
- Podporiť dialógový systém RASA
## Úlohy
- Zahrnúť transformery a predtrénované modely
- Nájsť optimálne hyperparametre
- Natrénovať vlastné WordEmbedding (fasttext).
## Súvisiace projekty
- Pripraviť trénovacie dáta pomocu frameworku [Prodigy](/topics/named-entity).
## Repozitár
- https://github.com/hladek/spacy-skmodel
- https://git.kemt.fei.tuke.sk/jo673fv/sk-spacy (slovenské stop words a pravidlá)
- [Repozitár Jozef Olekšák](https://git.kemt.fei.tuke.sk/jo673fv/sk-spacy)(slovenské stop words a pravidlá)
- https://files.kemt.fei.tuke.sk/minio/models/spacy/ Hotové spacy modely
## Ľudia
@ -30,5 +41,6 @@ taxonomy:
## Ukončené projekty
- Jozef Olekšák (slovenské stop words a pravidlá),
- [Lukáš Pokrývka](/students/2016/lukas_pokryvka) (Word Embedding Modely)
- [Martin Wencel](/students/2018/martin_wencel) demo aplikácia