forked from KEMT/zpwiki
1.5 KiB
1.5 KiB
Than Trung Thanh
Bakalársky projekt 2020
Rozpoznávanie pomenovaných entít v slovenskom jazyku
- Tvorba korpusu a modelu pomocou nástrojov Spacy a Prodigy
- Práca na internom projekte rozpoznávanie pomenovaných entít.
Osobné stretnutie 23.9.2020
Ciel je práce je zlepšiť presnosť rozpoznávania pomenovaných entít pre slovenský jazyk. Presnosť je možné zlepšiť pomocou nových trénovacích dát alebo pomocou zlepšenia procesu trénovania.
Predbežné zadanie:
- Vytvorte model pre rozpoznávanie pomenovaných entít v slovenčine. Využite existujúci model.
- Vyhodnotte model pre rozpoznávanie pomenovaných entít v slovenčine
Úlohy do ďalšieho stretnutia:
- preštudujte si, čo je to rozpoznávanie pomenovaných entít a ako sa robí, prečítajte si aj odborné články a knihy. Informácie získate zadaním hesla "named entity recognition".
- Nainštalujte si prostredie Anaconda.
- Nainštalujte si a spustite trénovanie existujúceho modelu.
- preštudujte materiály:
Dalšie stretnutie odporúčam o 2 týždne.