From df480788b6a716a69dd74a8da53712fac6975a20 Mon Sep 17 00:00:00 2001 From: dano Date: Tue, 30 Jun 2020 07:55:27 +0000 Subject: [PATCH] Update 'pages/students/2016/jakub_maruniak/README.md' --- pages/students/2016/jakub_maruniak/README.md | 14 ++++++++++++-- 1 file changed, 12 insertions(+), 2 deletions(-) diff --git a/pages/students/2016/jakub_maruniak/README.md b/pages/students/2016/jakub_maruniak/README.md index ad4b534d..25cb01ce 100644 --- a/pages/students/2016/jakub_maruniak/README.md +++ b/pages/students/2016/jakub_maruniak/README.md @@ -8,14 +8,24 @@ Výstupy (18.6.2020): - [Anotačná schéma](https://git.kemt.fei.tuke.sk/KEMT/zpwiki/src/branch/master/pages/students/2016/jakub_maruniak/dp2021/annotation) - [nasadenie anotačnej schémy](http://skner.tukekemt.xyz) +- [Korpus 1300 viet z wikipédie](https://git.kemt.fei.tuke.sk/KEMT/zpwiki/src/branch/master/pages/students/2016/jakub_maruniak/dp2021/annotation/ner/textfile.csv) + +Zásobník úloh: + +- Anotovať sadu dát s použitím produkčnej anotačnej schémy +- Natrénovať a vyhodnotiť model +- Použiť model na podporu anotácie Úlohy na semester: - Rozbehať anotačnú schému pre vyznačovanie slovenských pomenovaných entít - Vybrať a pripraviť vhodné dáta na anotáciu -- Anotovať sadu dát -- Natrénovať a vyhodnotiť model + +Stretnutie 30.6.2020: + +- Dodaný korpus 1300 viet +- Je dobré dáta rozdeliť na vety (odporúčanie, ľahšie sa sleduje anotované množstvo). Virtuálne stretnutie 15.5.2020: