forked from KEMT/zpwiki
1012 B
1012 B
title | published | taxonomy | |||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Spacy | true |
|
Podpora slovenčiny v knižnici Spacy
Úlohy
- Vytvoriť modul v jazyku Python pre podporu slovenčiny
- Pripraviť trénovacie dáta pomocu frameworku Prodigy.
- Natrénovať štatistické modely:
- pre morfologickú analýzu
- rozpoznávanie pomenovaných entít
Repozitár
- https://git.kemt.fei.tuke.sk/jo673fv/sk-spacy (slovenské stop words a pravidlá)
- https://git.kemt.fei.tuke.sk/dano/spacy-skmodel (slovenské NER a POS, vychádza s oficiálneho modelu, obsahuje niektoré dátové zdroje)
- https://files.kemt.fei.tuke.sk/minio/models/spacy/ Hotové spacy modely
Ľudia
- Maroš Harahus (štatistické značkovanie)
- Jozef Olekšák
- Lukáš Pokrývka (Word Embedding Modely)