1.4 KiB
1.4 KiB
title | published | taxonomy | |||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Podpora slovenčiny v knižnici Spacy | true |
|
Ciele
- Vytvoriť modul v jazyku Python pre podporu slovenčiny
- Natrénovať štatistické modely:
- pre morfologickú analýzu
- rozpoznávanie pomenovaných entít
- Unifikovaný systém pre predspracovanie slovenského jazyka
- Podporiť dialógový systém RASA
Úlohy
- Zahrnúť transformery a predtrénované modely
- Nájsť optimálne hyperparametre
- Natrénovať vlastné WordEmbedding (fasttext).
Súvisiace projekty
- Anotácia pomenovaných entít pomocu frameworku Prodigy.
- Predtrénovanie jazykového modelu
Repozitár
- https://github.com/hladek/spacy-skmodel
- Repozitár Jozef Olekšák(slovenské stop words a pravidlá)
- https://files.kemt.fei.tuke.sk/minio/models/spacy/ Hotové spacy modely
Ľudia
- Maroš Harahus (štatistické značkovanie)
- Kristián Sopkovič (vylepšenie parametrov, transformery)
Ukončené projekty
- Jozef Olekšák (slovenské stop words a pravidlá),
- Lukáš Pokrývka (Word Embedding Modely)
- Martin Wencel demo aplikácia