diff --git a/pages/students/2016/jakub_maruniak/dp2021/train_experiments.md b/pages/students/2016/jakub_maruniak/dp2021/train_experiments.md index e12f048af..973a1b438 100644 --- a/pages/students/2016/jakub_maruniak/dp2021/train_experiments.md +++ b/pages/students/2016/jakub_maruniak/dp2021/train_experiments.md @@ -4,7 +4,7 @@ Do tohto súboru sa budú postupne zapisovať štatistiky a poznámky ku vykonan V rámci experimentu pracujeme s dvomi databázami: - Wikiart - vlastná anotovaná databáza článkov. Každý článok = 1 veta. - - Skner - anotovaná databáza z https://skner.tukekemt.xyz/ . Počet viet v jednotlivých článkoch sa líši. + - Skner - anotovaná databáza z https://skner.tukekemt.xyz/ . Počet viet v jednotlivých článkoch je rôzny. ### Trénovanie Wikiart 1. Experiment - trénovanie modelu pomocou databázy Wikiart @@ -38,4 +38,34 @@ F-skóre natrénovaného modelu: 60,99% |PER|376|60,07%| |LOC|885|67,39%| |ORG|149|42,10%| -|MISC|80|8,69%| \ No newline at end of file +|MISC|80|8,69%| + +### 3. Experiment +3. Experiment - na natrénovanie modelu je využitá kompletná databáza Skner. Na testovanie modelu je využitá databáza Wikiart. + +15 iterácii trénovania. +F-skóre natrénovaného modelu: 49,67% + +| Entita | F-skóre | +|--|--| +|PER|39,08%| +|LOC|60,99%| +|ORG|27,77%| +|MISC|4,44%| + +### 4. Experiment +4. Experiment - Obe databázy sme zlúčili. + +![4.Merged](https://git.kemt.fei.tuke.sk/KEMT/zpwiki/raw/branch/master/pages/students/2016/jakub_maruniak/dp2021/img/4merged.PNG) + +Celkovo 989 článkov. +693 použitých na trénovanie, 296 na testovanie. +15 iterácii trénovania. +F-skóre natrénovaného modelu: 61,90% + +| Entita | Počet anotácii | F-skóre | +|--|--|--| +|PER|461|54,00%| +|LOC|1125|71,87%| +|ORG|179|42,00%| +|MISC|122|18,18%| \ No newline at end of file