diff --git a/pages/students/2016/jakub_maruniak/README.md b/pages/students/2016/jakub_maruniak/README.md index 33ec1abb1..946e0a208 100644 --- a/pages/students/2016/jakub_maruniak/README.md +++ b/pages/students/2016/jakub_maruniak/README.md @@ -3,7 +3,7 @@ title: Jakub Maruniak published: true taxonomy: category: [dp2021,bp2019] - tag: [spacy,ner,nlp] + tag: [spacy,ner,annotation,nlp] author: Daniel Hladek --- # Jakub Maruniak @@ -18,7 +18,18 @@ Zásobník úloh: - Anotovať sadu dát s použitím produkčnej anotačnej schémy - Použiť model na podporu anotácie - Do konca ZS vytvoriť report vo forme článku. +- Vytvorte systém pre zistenie množstva a druhu anotovaných dát. Koľko článkov? Koľko entít jednotlivvých typov? +Virtuálne stretnutie 16.10.2020: + +Stav: +- Spísané stručné poznámky k procesu anotácie +- Pokusne anotovaných niekoľko článkov + +Úlohy n a ďálšie stretnutie: +- Vylepšiť oficiálny návod na anotáciu NER https://zp.kemt.fei.tuke.sk/topics/named-entity/navod. +- Pripraviť skript na výber anotovaných dát z databázy a úpravu do podoby vhodnej pre trénovanie. +- Spísať pravidlá pre validáciu. Aký výsledok anotácie je dobrý? Je potrebné anotované dáta skontrolovať? Virtuálne stretnutie 9.10.2020: