diff --git a/pages/topics/named-entity/README.md b/pages/topics/named-entity/README.md index 8b32187089..52faeaa9ce 100644 --- a/pages/topics/named-entity/README.md +++ b/pages/topics/named-entity/README.md @@ -2,18 +2,20 @@ title: Pomenované entity --- - # Pomenované entity - ### Príprava dát +[Repozitár annotation/wikiparse](https://git.kemt.fei.tuke.sk/dano/annotation/src/branch/master/wikiparse) + Vstup: Wiki XML dump -Výstup: Korpus dokumentov pre anotáciu + +Výstup: Množina dokumentov pre anotáciu + urobené: -- Parsovanie XML Wiki DUMP https://git.kemt.fei.tuke.sk/dano/annotation/src/branch/master/wikicorpus +- Parsovanie XML Wiki DUMP urobiť: @@ -23,27 +25,43 @@ urobiť: ### Príprava anotačnej schémy +Vstup: dataset na anotovanie + Výstup: nasadená a pripravená aplikácia na anotovanie +[Repozitár annotation/ner](https://git.kemt.fei.tuke.sk/dano/annotation/src/branch/master/ner) + urobené: -- Deploymment Prodigy http://skner.tukekemt.xyz -- Konverzia dát do Prodigy https://git.kemt.fei.tuke.sk/dano/annotation/src/branch/master/ner +- [Deploymment Prodigy](http://skner.tukekemt.xyz) +- Konverzia dát do Prodigy urobiť: - Anotačný manuál - Sada značiek na anotáciu -- Podporný model? Ak pomáha tak pripraviť aj schému alebo dataset s podporným modelom. +- Podporný model? Ak pomáha tak pripraviť aj schému alebo dataset s podporným modelom. +- Pripraviť podrobné anotovanie "development" množiny ### Prípravná anotačná dávka +[Repozitár annotation/database_app](https://git.kemt.fei.tuke.sk/dano/annotation/src/branch/master/database_app) + +Vstup: + +- pripravená aplikácia pre anotovanie + +Výstup: + +- prvé anotované dáta +- aplikácia pre analýzu anotovaných dát +- skript pre spájanie a filtrovanie anotovaných dát + + urobené: - nasadenie aplikácie pre analýzu anotovaných dát http://aksner.tukekemt.xyz -https://git.kemt.fei.tuke.sk/dano/annotation/src/branch/master/database_app - prebieha: - aplikácia pre analýzu anotovaných dát - kto anotoval čo, ako a koľko @@ -55,6 +73,13 @@ urobiť: ### Produkčná anotačná dávka +Vstup: Pripravená aplikácia a dáta na anotovanie + +Výstup: + +- Anotované dáta +- korpus + treba urobiť: - Motivácia študentov