From 3e91ccd89c5845de2caa45f3951368d757429f04 Mon Sep 17 00:00:00 2001 From: Jakub Maruniak Date: Tue, 24 Nov 2020 12:06:37 +0000 Subject: [PATCH] =?UTF-8?q?Aktualizovat=20=E2=80=9Epages/students/2016/jak?= =?UTF-8?q?ub=5Fmaruniak/dp2021/train=5Fexperiments.md=E2=80=9C?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- .../dp2021/train_experiments.md | 41 ++++++++++++++++++- 1 file changed, 40 insertions(+), 1 deletion(-) diff --git a/pages/students/2016/jakub_maruniak/dp2021/train_experiments.md b/pages/students/2016/jakub_maruniak/dp2021/train_experiments.md index 7c4a013e..8acb54bc 100644 --- a/pages/students/2016/jakub_maruniak/dp2021/train_experiments.md +++ b/pages/students/2016/jakub_maruniak/dp2021/train_experiments.md @@ -1 +1,40 @@ -aaa \ No newline at end of file +# Trénovacie experimenty + +Do tohto súboru sa budú postupne zapisovať štatistiky a poznámky ku vykonaným trénovacím experimentom. + +V rámci experimentu pracujeme s dvomi databázami: + - Wikiart - vlastná anotovaná databáza článkov. Každý článok = 1 veta. + - Skner - anotovaná databáza z https://skner.tukekemt.xyz/ . Počet viet v jednotlivých článkoch sa líši. +### Trénovanie Wikiart +1. Experiment - trénovanie modelu pomocou databázy Wikiart +![1.Wikiart](/img/1wikiart.PNG) + +Celkovo 501 článkov. +351 použitých na trénovanie, 150 na testovanie. +15 iterácii trénovania. +F-skóre natrénovaného modelu: 55,55% + +| Entita | Počet anotácii | F-skóre | +|--|--|--| +|PER|85|41,66%| +|LOC|240|65,51%| +|ORG|30|0,0%| +|MISC|42|44,44%| + + +### Trénovanie Skner +2. Experiment - trénovanie modelu pomocou databázy skner. +![2.Skner](/img/2skner.PNG) + +Celkovo 488 článkov. +342 použitých na trénovanie, 146 na testovanie. +15 iterácii trénovania. + +F-skóre natrénovaného modelu: 60,99% + +| Entita | Počet anotácii | F-skóre | +|--|--|--| +|PER|376|60,07%| +|LOC|885|67,39%| +|ORG|149|42,10%| +|MISC|80|8,69%| \ No newline at end of file