diff --git a/pages/topics/named-entity/README.md b/pages/topics/named-entity/README.md index a51d24e2..f88948db 100644 --- a/pages/topics/named-entity/README.md +++ b/pages/topics/named-entity/README.md @@ -2,14 +2,43 @@ title: Pomenované entity --- + # Pomenované entity + ## Goals - Be able to recognize unknown named entities - Create a manually annotated training set from speech transcripts - Propose an annotation schema + +## Tasks + +### Príprava dát + +- Parsovanie XML Wiki DUMP +- Filter pre vyradenie článkov +- Ručný výber článkov + +### Príprava anotačnej schémy + +- Deploymment Prodigy +- Konverzia dát do Prodigy +- Anotačný manuál +- Sada značiek na anotáciu +- Podporný model? + +### Prípravná anotačná dávka + +### Produkčná anotačná dávka + +- Motivácia študentov + +### Analýza vykonaných anotácií + +Aplikácia pre analýzu anotácií + ## Plan - Convert speech transcripts into a training set