From 334a3b66e8d30d075792997a5b50fc7d8883ebb3 Mon Sep 17 00:00:00 2001 From: dano Date: Fri, 13 Nov 2020 08:41:17 +0000 Subject: [PATCH] Update 'pages/students/2016/jakub_maruniak/README.md' --- pages/students/2016/jakub_maruniak/README.md | 10 +++++++++- 1 file changed, 9 insertions(+), 1 deletion(-) diff --git a/pages/students/2016/jakub_maruniak/README.md b/pages/students/2016/jakub_maruniak/README.md index 59931243e..57589e3dd 100644 --- a/pages/students/2016/jakub_maruniak/README.md +++ b/pages/students/2016/jakub_maruniak/README.md @@ -21,7 +21,8 @@ Zásobník úloh: - Použiť model na podporu anotácie - Do konca ZS vytvoriť report vo forme článku. -- Spísať pravidlá pre validáciu. Aký výsledok anotácie je dobrý? Je potrebné anotované dáta skontrolovať? + + Virtuálne stretnutie 13.11.2020: @@ -30,6 +31,13 @@ Virtuálne stretnutie 13.11.2020: - začiatok práce na skripte pre počítanie anotovaných entít, treba ešte vylepšiť aby vznikla tabuľka. - anotačná schéma vyzerá byť v poriadku, niektoré články treba odfiltrovať (zoznam obrázkov, prázdna kategória, nadpis). +Úlohy do ďalšieho stretnutia: + +- vytvoriť spôsob pre získanie dát z produkčnej anotačnej schémy. (pre vedúceho) +- vytvorte ďalšie anotácie. +- Spísať pravidlá pre validáciu. Aký výsledok anotácie je dobrý? Je potrebné anotované dáta skontrolovať? +- Vytvorte tabuľku kde uvediete presnosť modelu s rôznym množstvom anotovaných dát. +- Aký je najlepší spôsob vyhodnotnenia? Vytvoriť jednotnú testovaciu množinu. Druhý spôsob je použiť "10 fold cross validation" (Všetky dáta sa rozdelia na 10 častí, 9 sa využije pri trénovaní, 1 pri testovaní. Trénovanie sa opakuje 10 krát stále pre inú testovaciu množinu, výsledky sa spriemerujú). Virtuálne stretnutie 30.10.2020: