diff --git a/pages/topics/spacy/sREADME.md b/pages/topics/spacy/sREADME.md index 9e352a56..25d4396b 100644 --- a/pages/topics/spacy/sREADME.md +++ b/pages/topics/spacy/sREADME.md @@ -9,18 +9,29 @@ taxonomy: [Trénovanie modelov Spacy](https://spacy.io/usage/training) -## Úlohy +## Ciele - Vytvoriť modul v jazyku Python pre podporu slovenčiny -- Pripraviť trénovacie dáta pomocu frameworku [Prodigy](/topics/prodigy). - Natrénovať štatistické modely: - pre morfologickú analýzu - rozpoznávanie pomenovaných entít +- Unifikovaný systém pre predspracovanie slovenského jazyka +- Podporiť dialógový systém RASA + +## Úlohy + +- Zahrnúť transformery a predtrénované modely +- Nájsť optimálne hyperparametre +- Natrénovať vlastné WordEmbedding (fasttext). + +## Súvisiace projekty + +- Pripraviť trénovacie dáta pomocu frameworku [Prodigy](/topics/named-entity). ## Repozitár - https://github.com/hladek/spacy-skmodel -- https://git.kemt.fei.tuke.sk/jo673fv/sk-spacy (slovenské stop words a pravidlá) +- [Repozitár Jozef Olekšák](https://git.kemt.fei.tuke.sk/jo673fv/sk-spacy)(slovenské stop words a pravidlá) - https://files.kemt.fei.tuke.sk/minio/models/spacy/ Hotové spacy modely ## Ľudia @@ -30,5 +41,6 @@ taxonomy: ## Ukončené projekty +- Jozef Olekšák (slovenské stop words a pravidlá), - [Lukáš Pokrývka](/students/2016/lukas_pokryvka) (Word Embedding Modely) - [Martin Wencel](/students/2018/martin_wencel) demo aplikácia