2019-11-19 12:07:02 +00:00
|
|
|
---
|
|
|
|
title: Anotácia textových dát
|
|
|
|
published: true
|
|
|
|
---
|
|
|
|
|
|
|
|
# Anotácia textových dát
|
|
|
|
|
|
|
|
- Natrénovanie štatistického modelu pre spracovanie prirodzeného jazyka zo slovenských dát
|
|
|
|
- Manuálna anotácia slovenských dát pre výskyt pomenovaných entít
|
|
|
|
|
|
|
|
## Postup
|
|
|
|
|
|
|
|
- Definovanie anotačnej schémy
|
|
|
|
- Príprava dátovej množiny vhodnej na anotáciu
|
|
|
|
- Natrénovanie štatistického modelu Spacy
|
|
|
|
- Príprava anotačnej úlohy Prodigy
|
|
|
|
|
|
|
|
## Nástroje
|
|
|
|
|
|
|
|
- Python (príprava dát)
|
|
|
|
- Spacy (štatistický model) [Spacy](https://spacy.io/))
|
|
|
|
- [Prodigy](https://prodi.gy/) (anotácie)
|
|
|
|
|
|
|
|
## Riešitelia
|
|
|
|
|
|
|
|
- Andrej Hopko (BP)
|
|
|
|
- Lukáš Pokrývka (TP)
|
|
|
|
- Jakub Maruniak
|
2020-01-25 16:23:44 +00:00
|
|
|
- [Cesar Gutierez](/topics/named-entity) (stáž leto 2019)
|
2019-11-19 12:07:02 +00:00
|
|
|
|