Aktualizovat „pages/students/2016/jakub_maruniak/dp2021/train_experiments.md“
This commit is contained in:
parent
feca1a0515
commit
b37c4fc563
@ -4,7 +4,7 @@ Do tohto súboru sa budú postupne zapisovať štatistiky a poznámky ku vykonan
|
||||
|
||||
V rámci experimentu pracujeme s dvomi databázami:
|
||||
- Wikiart - vlastná anotovaná databáza článkov. Každý článok = 1 veta.
|
||||
- Skner - anotovaná databáza z https://skner.tukekemt.xyz/ . Počet viet v jednotlivých článkoch sa líši.
|
||||
- Skner - anotovaná databáza z https://skner.tukekemt.xyz/ . Počet viet v jednotlivých článkoch je rôzny.
|
||||
### Trénovanie Wikiart
|
||||
1. Experiment - trénovanie modelu pomocou databázy Wikiart
|
||||
|
||||
@ -39,3 +39,33 @@ F-skóre natrénovaného modelu: 60,99%
|
||||
|LOC|885|67,39%|
|
||||
|ORG|149|42,10%|
|
||||
|MISC|80|8,69%|
|
||||
|
||||
### 3. Experiment
|
||||
3. Experiment - na natrénovanie modelu je využitá kompletná databáza Skner. Na testovanie modelu je využitá databáza Wikiart.
|
||||
|
||||
15 iterácii trénovania.
|
||||
F-skóre natrénovaného modelu: 49,67%
|
||||
|
||||
| Entita | F-skóre |
|
||||
|--|--|
|
||||
|PER|39,08%|
|
||||
|LOC|60,99%|
|
||||
|ORG|27,77%|
|
||||
|MISC|4,44%|
|
||||
|
||||
### 4. Experiment
|
||||
4. Experiment - Obe databázy sme zlúčili.
|
||||
|
||||
![4.Merged](https://git.kemt.fei.tuke.sk/KEMT/zpwiki/raw/branch/master/pages/students/2016/jakub_maruniak/dp2021/img/4merged.PNG)
|
||||
|
||||
Celkovo 989 článkov.
|
||||
693 použitých na trénovanie, 296 na testovanie.
|
||||
15 iterácii trénovania.
|
||||
F-skóre natrénovaného modelu: 61,90%
|
||||
|
||||
| Entita | Počet anotácii | F-skóre |
|
||||
|--|--|--|
|
||||
|PER|461|54,00%|
|
||||
|LOC|1125|71,87%|
|
||||
|ORG|179|42,00%|
|
||||
|MISC|122|18,18%|
|
Loading…
Reference in New Issue
Block a user