diff --git a/pages/students/2016/jakub_maruniak/README.md b/pages/students/2016/jakub_maruniak/README.md index 5908689f..7692d2c3 100644 --- a/pages/students/2016/jakub_maruniak/README.md +++ b/pages/students/2016/jakub_maruniak/README.md @@ -21,8 +21,21 @@ Zásobník úloh: - Použiť model na podporu anotácie - Do konca ZS vytvoriť report vo forme článku. -- Vytvorte systém pre zistenie množstva a druhu anotovaných dát. Koľko článkov? Koľko entít jednotlivvých typov? +- Spísať pravidlá pre validáciu. Aký výsledok anotácie je dobrý? Je potrebné anotované dáta skontrolovať? +Virtuálne stretnutie 30.10.2020: + +Stav: + +- Vylepšený návod +- Vyskúšaný export dát a trénovanie modelu z databázy. Problém pri trénovaní Spacy - iné výsledky ako cez Progigy trénovanie +- Práca na textovej čsati. + +Úlohy do ďalšieho stretnutia: +- Vytvorte si repozitár s názvom dp2021 a tam pridajte skripty a poznámky. +- Pokračujte v písaní práce. Vykonajte prieskum literatúry "named entity corpora" aj poznámky. +- Vytvorte systém pre zistenie množstva a druhu anotovaných dát. Koľko článkov? Koľko entít jednotlivvých typov? Výsledná tabuľka pôjde do práce. +- Pripraviť sa na produkčné anotácie. Je schéma pripravená? Virtuálne stretnutie 16.10.2020: