892 B
892 B
title |
---|
Spacy |
Podpora slovenčiny v knižnici Spacy
Úlohy
- Vytvoriť modul v jazyku Python pre podporu slovenčiny
- Pripraviť trénovacie dáta pomocu frameworku Prodigy.
- Natrénovať štatistické modely:
- pre morfologickú analýzu
- rozpoznávanie pomenovaných entít
Repozitár
- https://git.kemt.fei.tuke.sk/jo673fv/sk-spacy (slovenské stop words a pravidlá)
- https://git.kemt.fei.tuke.sk/dano/spacy-skmodel (slovenské NER a POS, vychádza s oficiálneho modelu, obsahuje niektoré dátové zdroje)
- https://files.kemt.fei.tuke.sk/minio/models/spacy/ Hotové spacy modely
Ľudia
- Maroš Harahus (štatistické značkovanie)
- Jozef Olekšák
- Lukáš Pokrývka (Word Embedding Modely)