From 6c2a8ff77b046940bf52e0f53c159eb3a13ad1a9 Mon Sep 17 00:00:00 2001 From: dano Date: Tue, 30 Jun 2020 13:13:17 +0000 Subject: [PATCH] Update 'pages/topics/named-entity/README.md' --- pages/topics/named-entity/README.md | 29 +++++++++++++++++++++++++++++ 1 file changed, 29 insertions(+) diff --git a/pages/topics/named-entity/README.md b/pages/topics/named-entity/README.md index a51d24e2..f88948db 100644 --- a/pages/topics/named-entity/README.md +++ b/pages/topics/named-entity/README.md @@ -2,14 +2,43 @@ title: Pomenované entity --- + # Pomenované entity + ## Goals - Be able to recognize unknown named entities - Create a manually annotated training set from speech transcripts - Propose an annotation schema + +## Tasks + +### Príprava dát + +- Parsovanie XML Wiki DUMP +- Filter pre vyradenie článkov +- Ručný výber článkov + +### Príprava anotačnej schémy + +- Deploymment Prodigy +- Konverzia dát do Prodigy +- Anotačný manuál +- Sada značiek na anotáciu +- Podporný model? + +### Prípravná anotačná dávka + +### Produkčná anotačná dávka + +- Motivácia študentov + +### Analýza vykonaných anotácií + +Aplikácia pre analýzu anotácií + ## Plan - Convert speech transcripts into a training set