From 395a885b216662f098e140c272937282c1be2fad Mon Sep 17 00:00:00 2001 From: dano Date: Fri, 16 Oct 2020 07:20:23 +0000 Subject: [PATCH] Update 'pages/students/2016/jakub_maruniak/README.md' --- pages/students/2016/jakub_maruniak/README.md | 13 ++++++++++++- 1 file changed, 12 insertions(+), 1 deletion(-) diff --git a/pages/students/2016/jakub_maruniak/README.md b/pages/students/2016/jakub_maruniak/README.md index 33ec1abb..946e0a20 100644 --- a/pages/students/2016/jakub_maruniak/README.md +++ b/pages/students/2016/jakub_maruniak/README.md @@ -3,7 +3,7 @@ title: Jakub Maruniak published: true taxonomy: category: [dp2021,bp2019] - tag: [spacy,ner,nlp] + tag: [spacy,ner,annotation,nlp] author: Daniel Hladek --- # Jakub Maruniak @@ -18,7 +18,18 @@ Zásobník úloh: - Anotovať sadu dát s použitím produkčnej anotačnej schémy - Použiť model na podporu anotácie - Do konca ZS vytvoriť report vo forme článku. +- Vytvorte systém pre zistenie množstva a druhu anotovaných dát. Koľko článkov? Koľko entít jednotlivvých typov? +Virtuálne stretnutie 16.10.2020: + +Stav: +- Spísané stručné poznámky k procesu anotácie +- Pokusne anotovaných niekoľko článkov + +Úlohy n a ďálšie stretnutie: +- Vylepšiť oficiálny návod na anotáciu NER https://zp.kemt.fei.tuke.sk/topics/named-entity/navod. +- Pripraviť skript na výber anotovaných dát z databázy a úpravu do podoby vhodnej pre trénovanie. +- Spísať pravidlá pre validáciu. Aký výsledok anotácie je dobrý? Je potrebné anotované dáta skontrolovať? Virtuálne stretnutie 9.10.2020: