From 90bc4f35717952ad05799a24e4b72c1ce4d30989 Mon Sep 17 00:00:00 2001 From: Jakub Maruniak Date: Thu, 14 Jan 2021 11:00:52 +0000 Subject: [PATCH] =?UTF-8?q?Aktualizovat=20=E2=80=9Epages/students/2016/jak?= =?UTF-8?q?ub=5Fmaruniak/dp2021/train=5Fexperiments/README.md=E2=80=9C?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- .../dp2021/train_experiments/README.md | 68 ++++++++++++++++++- 1 file changed, 67 insertions(+), 1 deletion(-) diff --git a/pages/students/2016/jakub_maruniak/dp2021/train_experiments/README.md b/pages/students/2016/jakub_maruniak/dp2021/train_experiments/README.md index 973a1b438e..312eb93d95 100644 --- a/pages/students/2016/jakub_maruniak/dp2021/train_experiments/README.md +++ b/pages/students/2016/jakub_maruniak/dp2021/train_experiments/README.md @@ -28,6 +28,7 @@ F-skóre natrénovaného modelu: 55,55% ![2.Skner](https://git.kemt.fei.tuke.sk/KEMT/zpwiki/raw/branch/master/pages/students/2016/jakub_maruniak/dp2021/img/2skner.PNG) +1. Celkovo 488 článkov. 342 použitých na trénovanie, 146 na testovanie. 15 iterácii trénovania. @@ -40,9 +41,38 @@ F-skóre natrénovaného modelu: 60,99% |ORG|149|42,10%| |MISC|80|8,69%| +2. +Celkovo 976 článkov. +684 použitých na trénovanie, 292 na testovanie. +15 iterácii trénovania. +F-skóre natrénovaného modelu: 62,9%% + +| Entita | Počet anotácii | F-skóre | +|--|--|--| +|PER|684|60,68%| +|LOC|1417|70,45%| +|ORG|280|40,87%| +|MISC|416|43,08%| + + +3. +Celkovo 2696 článkov. +1871 použitých na trénovanie, 801 na testovanie. +15 iterácii trénovania. +F-skóre natrénovaného modelu: 70.33% + +| Entita | Počet anotácii | F-skóre | +|--|--|--| +|PER|1886|71,08%| +|LOC|3678|79,01%| +|ORG|820|48,81%| +|MISC|1171|52,38%| + + ### 3. Experiment 3. Experiment - na natrénovanie modelu je využitá kompletná databáza Skner. Na testovanie modelu je využitá databáza Wikiart. +1.verzia databázy skner - 488 článkov 15 iterácii trénovania. F-skóre natrénovaného modelu: 49,67% @@ -53,11 +83,34 @@ F-skóre natrénovaného modelu: 49,67% |ORG|27,77%| |MISC|4,44%| +2.verzia databázy skner - 976 článkov +15 iterácii trénovania. +F-skóre natrénovaného modelu: 51,08% + +| Entita | F-skóre | +|--|--| +|PER|38,22%| +|LOC|60,83%| +|ORG|33,33%| +|MISC|30,30%| + +3.verzia databázy skner - 2672 článkov +15 iterácii trénovania. +F-skóre natrénovaného modelu: 56,26% + +| Entita | F-skóre | +|--|--| +|PER|45,35%| +|LOC|67,25%| +|ORG|31,58%| +|MISC|39,47%| + ### 4. Experiment 4. Experiment - Obe databázy sme zlúčili. ![4.Merged](https://git.kemt.fei.tuke.sk/KEMT/zpwiki/raw/branch/master/pages/students/2016/jakub_maruniak/dp2021/img/4merged.PNG) +1. verzia Celkovo 989 článkov. 693 použitých na trénovanie, 296 na testovanie. 15 iterácii trénovania. @@ -68,4 +121,17 @@ F-skóre natrénovaného modelu: 61,90% |PER|461|54,00%| |LOC|1125|71,87%| |ORG|179|42,00%| -|MISC|122|18,18%| \ No newline at end of file +|MISC|122|18,18%| + +2. verzia +Celkovo 3197 článkov. +2222 použitých na trénovanie, 951 na testovanie. +15 iterácii trénovania. +F-skóre natrénovaného modelu: 70,48% + +| Entita | Počet anotácii | F-skóre | +|--|--|--| +|PER|1971|69,18%| +|LOC|3918|80,52%| +|ORG|850|42,33%| +|MISC|1213|50,24%| \ No newline at end of file