diff --git a/pages/students/2016/jakub_maruniak/dp2021/train_experiments/README.md b/pages/students/2016/jakub_maruniak/dp2021/train_experiments/README.md index 973a1b438e..312eb93d95 100644 --- a/pages/students/2016/jakub_maruniak/dp2021/train_experiments/README.md +++ b/pages/students/2016/jakub_maruniak/dp2021/train_experiments/README.md @@ -28,6 +28,7 @@ F-skóre natrénovaného modelu: 55,55% ![2.Skner](https://git.kemt.fei.tuke.sk/KEMT/zpwiki/raw/branch/master/pages/students/2016/jakub_maruniak/dp2021/img/2skner.PNG) +1. Celkovo 488 článkov. 342 použitých na trénovanie, 146 na testovanie. 15 iterácii trénovania. @@ -40,9 +41,38 @@ F-skóre natrénovaného modelu: 60,99% |ORG|149|42,10%| |MISC|80|8,69%| +2. +Celkovo 976 článkov. +684 použitých na trénovanie, 292 na testovanie. +15 iterácii trénovania. +F-skóre natrénovaného modelu: 62,9%% + +| Entita | Počet anotácii | F-skóre | +|--|--|--| +|PER|684|60,68%| +|LOC|1417|70,45%| +|ORG|280|40,87%| +|MISC|416|43,08%| + + +3. +Celkovo 2696 článkov. +1871 použitých na trénovanie, 801 na testovanie. +15 iterácii trénovania. +F-skóre natrénovaného modelu: 70.33% + +| Entita | Počet anotácii | F-skóre | +|--|--|--| +|PER|1886|71,08%| +|LOC|3678|79,01%| +|ORG|820|48,81%| +|MISC|1171|52,38%| + + ### 3. Experiment 3. Experiment - na natrénovanie modelu je využitá kompletná databáza Skner. Na testovanie modelu je využitá databáza Wikiart. +1.verzia databázy skner - 488 článkov 15 iterácii trénovania. F-skóre natrénovaného modelu: 49,67% @@ -53,11 +83,34 @@ F-skóre natrénovaného modelu: 49,67% |ORG|27,77%| |MISC|4,44%| +2.verzia databázy skner - 976 článkov +15 iterácii trénovania. +F-skóre natrénovaného modelu: 51,08% + +| Entita | F-skóre | +|--|--| +|PER|38,22%| +|LOC|60,83%| +|ORG|33,33%| +|MISC|30,30%| + +3.verzia databázy skner - 2672 článkov +15 iterácii trénovania. +F-skóre natrénovaného modelu: 56,26% + +| Entita | F-skóre | +|--|--| +|PER|45,35%| +|LOC|67,25%| +|ORG|31,58%| +|MISC|39,47%| + ### 4. Experiment 4. Experiment - Obe databázy sme zlúčili. ![4.Merged](https://git.kemt.fei.tuke.sk/KEMT/zpwiki/raw/branch/master/pages/students/2016/jakub_maruniak/dp2021/img/4merged.PNG) +1. verzia Celkovo 989 článkov. 693 použitých na trénovanie, 296 na testovanie. 15 iterácii trénovania. @@ -68,4 +121,17 @@ F-skóre natrénovaného modelu: 61,90% |PER|461|54,00%| |LOC|1125|71,87%| |ORG|179|42,00%| -|MISC|122|18,18%| \ No newline at end of file +|MISC|122|18,18%| + +2. verzia +Celkovo 3197 článkov. +2222 použitých na trénovanie, 951 na testovanie. +15 iterácii trénovania. +F-skóre natrénovaného modelu: 70,48% + +| Entita | Počet anotácii | F-skóre | +|--|--|--| +|PER|1971|69,18%| +|LOC|3918|80,52%| +|ORG|850|42,33%| +|MISC|1213|50,24%| \ No newline at end of file