From 313b49704eb51febe1e1d4a94629910295523ada Mon Sep 17 00:00:00 2001 From: dano Date: Thu, 28 Jan 2021 13:04:24 +0000 Subject: [PATCH] Update 'pages/students/2017/than_trung_thanh/README.md' --- pages/students/2017/than_trung_thanh/README.md | 17 ++++++++++++----- 1 file changed, 12 insertions(+), 5 deletions(-) diff --git a/pages/students/2017/than_trung_thanh/README.md b/pages/students/2017/than_trung_thanh/README.md index 5a386af8..464bbdee 100644 --- a/pages/students/2017/than_trung_thanh/README.md +++ b/pages/students/2017/than_trung_thanh/README.md @@ -14,6 +14,16 @@ Rozpoznávanie pomenovaných entít v slovenskom jazyku - Tvorba korpusu a modelu pomocou nástrojov Spacy a Prodigy - Práca na internom projekte [rozpoznávanie pomenovaných entít](https://git.kemt.fei.tuke.sk/KEMT/zpwiki/src/branch/master/pages/topics/named-entity). +- Využite [existujúci model](https://git.kemt.fei.tuke.sk/dano/spacy-skmodel). + + +Predbežné zadanie: + +- Vypracujte teoretický úvod, kde vysvetlíte čo je to rozpoznávanie pomenovaných entít a akými najnovšími metódami sa robí. +- Vysvetlite, ako pracuje klasifikátor pre rozpoznávanie pomenovaných entít v knižnici Spacy . +- Pomocou nástroja Prodigy anotujte dostatočné množstvo textu z pre výskyt pomenovaných entít. +- Pomocou nástroja Spacy Vytvorte a vyhodnotte model pre rozpoznávanie pomenovaných entít v slovenčine. +- Zistite, ako Vami anotované dáta zlepšili presnosť vytvoreného modelu. Osobné stretnutie 23.9.2020 @@ -26,16 +36,13 @@ Stav: - Preštudované Spacy a Prodigy. - Pokus o spracovanie XML dump Wikipédia. - Prečítané blogy. -- Urobená prezentácia +- Urobená prezentácia. +- Natrénovaný model. Úlohy: - Začať pracovať na písomnej časti. -Predbežné zadanie: - -- Vytvorte model pre rozpoznávanie pomenovaných entít v slovenčine. Využite [existujúci model](https://git.kemt.fei.tuke.sk/dano/spacy-skmodel). -- Vyhodnotte model pre rozpoznávanie pomenovaných entít v slovenčine Úlohy do ďalšieho stretnutia: