dmytro_ushatenko/pages/topics/prodigy
2020-10-01 16:05:57 +02:00
..
README.md zz 2020-10-01 16:05:57 +02:00

title published taxonomy
Anotácia textových dát true
category tag author
project
annotation
ner
question-answer
nlp
Daniel Hladek

Anotácia textových dát

  • Natrénovanie štatistického modelu pre spracovanie prirodzeného jazyka zo slovenských dát
  • Manuálna anotácia slovenských dát pre výskyt pomenovaných entít

Postup

  • Definovanie anotačnej schémy
  • Príprava dátovej množiny vhodnej na anotáciu
  • Natrénovanie štatistického modelu Spacy
  • Príprava anotačnej úlohy Prodigy

Nástroje

  • Python (príprava dát)
  • Spacy (štatistický model) Spacy)
  • Prodigy (anotácie)

Riešitelia

  • Andrej Hopko (BP, ex?)
  • Tomáš Kuchárik (príprava dát z wikipedie)
  • Jakub Maruniak
  • Cesar Gutierez (stáž leto 2019)