diff --git a/pages/students/2017/than_trung_thanh/README.md b/pages/students/2017/than_trung_thanh/README.md index 5a386af8..464bbdee 100644 --- a/pages/students/2017/than_trung_thanh/README.md +++ b/pages/students/2017/than_trung_thanh/README.md @@ -14,6 +14,16 @@ Rozpoznávanie pomenovaných entít v slovenskom jazyku - Tvorba korpusu a modelu pomocou nástrojov Spacy a Prodigy - Práca na internom projekte [rozpoznávanie pomenovaných entít](https://git.kemt.fei.tuke.sk/KEMT/zpwiki/src/branch/master/pages/topics/named-entity). +- Využite [existujúci model](https://git.kemt.fei.tuke.sk/dano/spacy-skmodel). + + +Predbežné zadanie: + +- Vypracujte teoretický úvod, kde vysvetlíte čo je to rozpoznávanie pomenovaných entít a akými najnovšími metódami sa robí. +- Vysvetlite, ako pracuje klasifikátor pre rozpoznávanie pomenovaných entít v knižnici Spacy . +- Pomocou nástroja Prodigy anotujte dostatočné množstvo textu z pre výskyt pomenovaných entít. +- Pomocou nástroja Spacy Vytvorte a vyhodnotte model pre rozpoznávanie pomenovaných entít v slovenčine. +- Zistite, ako Vami anotované dáta zlepšili presnosť vytvoreného modelu. Osobné stretnutie 23.9.2020 @@ -26,16 +36,13 @@ Stav: - Preštudované Spacy a Prodigy. - Pokus o spracovanie XML dump Wikipédia. - Prečítané blogy. -- Urobená prezentácia +- Urobená prezentácia. +- Natrénovaný model. Úlohy: - Začať pracovať na písomnej časti. -Predbežné zadanie: - -- Vytvorte model pre rozpoznávanie pomenovaných entít v slovenčine. Využite [existujúci model](https://git.kemt.fei.tuke.sk/dano/spacy-skmodel). -- Vyhodnotte model pre rozpoznávanie pomenovaných entít v slovenčine Úlohy do ďalšieho stretnutia: