From b37c4fc563f04450bc56c1b36455bad9346afdf8 Mon Sep 17 00:00:00 2001 From: Jakub Maruniak Date: Tue, 24 Nov 2020 19:14:32 +0000 Subject: [PATCH] =?UTF-8?q?Aktualizovat=20=E2=80=9Epages/students/2016/jak?= =?UTF-8?q?ub=5Fmaruniak/dp2021/train=5Fexperiments.md=E2=80=9C?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- .../dp2021/train_experiments.md | 34 +++++++++++++++++-- 1 file changed, 32 insertions(+), 2 deletions(-) diff --git a/pages/students/2016/jakub_maruniak/dp2021/train_experiments.md b/pages/students/2016/jakub_maruniak/dp2021/train_experiments.md index e12f048af..973a1b438 100644 --- a/pages/students/2016/jakub_maruniak/dp2021/train_experiments.md +++ b/pages/students/2016/jakub_maruniak/dp2021/train_experiments.md @@ -4,7 +4,7 @@ Do tohto súboru sa budú postupne zapisovať štatistiky a poznámky ku vykonan V rámci experimentu pracujeme s dvomi databázami: - Wikiart - vlastná anotovaná databáza článkov. Každý článok = 1 veta. - - Skner - anotovaná databáza z https://skner.tukekemt.xyz/ . Počet viet v jednotlivých článkoch sa líši. + - Skner - anotovaná databáza z https://skner.tukekemt.xyz/ . Počet viet v jednotlivých článkoch je rôzny. ### Trénovanie Wikiart 1. Experiment - trénovanie modelu pomocou databázy Wikiart @@ -38,4 +38,34 @@ F-skóre natrénovaného modelu: 60,99% |PER|376|60,07%| |LOC|885|67,39%| |ORG|149|42,10%| -|MISC|80|8,69%| \ No newline at end of file +|MISC|80|8,69%| + +### 3. Experiment +3. Experiment - na natrénovanie modelu je využitá kompletná databáza Skner. Na testovanie modelu je využitá databáza Wikiart. + +15 iterácii trénovania. +F-skóre natrénovaného modelu: 49,67% + +| Entita | F-skóre | +|--|--| +|PER|39,08%| +|LOC|60,99%| +|ORG|27,77%| +|MISC|4,44%| + +### 4. Experiment +4. Experiment - Obe databázy sme zlúčili. + +![4.Merged](https://git.kemt.fei.tuke.sk/KEMT/zpwiki/raw/branch/master/pages/students/2016/jakub_maruniak/dp2021/img/4merged.PNG) + +Celkovo 989 článkov. +693 použitých na trénovanie, 296 na testovanie. +15 iterácii trénovania. +F-skóre natrénovaného modelu: 61,90% + +| Entita | Počet anotácii | F-skóre | +|--|--|--| +|PER|461|54,00%| +|LOC|1125|71,87%| +|ORG|179|42,00%| +|MISC|122|18,18%| \ No newline at end of file