This commit is contained in:
Daniel Hladek 2020-07-01 18:37:29 +02:00
parent 965d5e7dcd
commit a27cbe2f7a

View File

@ -2,18 +2,20 @@
title: Pomenované entity
---
# Pomenované entity
### Príprava dát
[Repozitár annotation/wikiparse](https://git.kemt.fei.tuke.sk/dano/annotation/src/branch/master/wikiparse)
Vstup: Wiki XML dump
Výstup: Korpus dokumentov pre anotáciu
Výstup: Množina dokumentov pre anotáciu
urobené:
- Parsovanie XML Wiki DUMP https://git.kemt.fei.tuke.sk/dano/annotation/src/branch/master/wikicorpus
- Parsovanie XML Wiki DUMP
urobiť:
@ -23,27 +25,43 @@ urobiť:
### Príprava anotačnej schémy
Vstup: dataset na anotovanie
Výstup: nasadená a pripravená aplikácia na anotovanie
[Repozitár annotation/ner](https://git.kemt.fei.tuke.sk/dano/annotation/src/branch/master/ner)
urobené:
- Deploymment Prodigy http://skner.tukekemt.xyz
- Konverzia dát do Prodigy https://git.kemt.fei.tuke.sk/dano/annotation/src/branch/master/ner
- [Deploymment Prodigy](http://skner.tukekemt.xyz)
- Konverzia dát do Prodigy
urobiť:
- Anotačný manuál
- Sada značiek na anotáciu
- Podporný model? Ak pomáha tak pripraviť aj schému alebo dataset s podporným modelom.
- Pripraviť podrobné anotovanie "development" množiny
### Prípravná anotačná dávka
[Repozitár annotation/database_app](https://git.kemt.fei.tuke.sk/dano/annotation/src/branch/master/database_app)
Vstup:
- pripravená aplikácia pre anotovanie
Výstup:
- prvé anotované dáta
- aplikácia pre analýzu anotovaných dát
- skript pre spájanie a filtrovanie anotovaných dát
urobené:
- nasadenie aplikácie pre analýzu anotovaných dát http://aksner.tukekemt.xyz
https://git.kemt.fei.tuke.sk/dano/annotation/src/branch/master/database_app
prebieha:
- aplikácia pre analýzu anotovaných dát - kto anotoval čo, ako a koľko
@ -55,6 +73,13 @@ urobiť:
### Produkčná anotačná dávka
Vstup: Pripravená aplikácia a dáta na anotovanie
Výstup:
- Anotované dáta
- korpus
treba urobiť:
- Motivácia študentov