diff --git a/pages/students/2016/jakub_maruniak/README.md b/pages/students/2016/jakub_maruniak/README.md index 59931243..57589e3d 100644 --- a/pages/students/2016/jakub_maruniak/README.md +++ b/pages/students/2016/jakub_maruniak/README.md @@ -21,7 +21,8 @@ Zásobník úloh: - Použiť model na podporu anotácie - Do konca ZS vytvoriť report vo forme článku. -- Spísať pravidlá pre validáciu. Aký výsledok anotácie je dobrý? Je potrebné anotované dáta skontrolovať? + + Virtuálne stretnutie 13.11.2020: @@ -30,6 +31,13 @@ Virtuálne stretnutie 13.11.2020: - začiatok práce na skripte pre počítanie anotovaných entít, treba ešte vylepšiť aby vznikla tabuľka. - anotačná schéma vyzerá byť v poriadku, niektoré články treba odfiltrovať (zoznam obrázkov, prázdna kategória, nadpis). +Úlohy do ďalšieho stretnutia: + +- vytvoriť spôsob pre získanie dát z produkčnej anotačnej schémy. (pre vedúceho) +- vytvorte ďalšie anotácie. +- Spísať pravidlá pre validáciu. Aký výsledok anotácie je dobrý? Je potrebné anotované dáta skontrolovať? +- Vytvorte tabuľku kde uvediete presnosť modelu s rôznym množstvom anotovaných dát. +- Aký je najlepší spôsob vyhodnotnenia? Vytvoriť jednotnú testovaciu množinu. Druhý spôsob je použiť "10 fold cross validation" (Všetky dáta sa rozdelia na 10 častí, 9 sa využije pri trénovaní, 1 pri testovaní. Trénovanie sa opakuje 10 krát stále pre inú testovaciu množinu, výsledky sa spriemerujú). Virtuálne stretnutie 30.10.2020: