zpwiki/pages/students/2017/than_trung_thanh
2021-01-28 13:08:25 +00:00
..
README.md Update 'pages/students/2017/than_trung_thanh/README.md' 2021-01-28 13:08:25 +00:00

title published taxonomy
Than Trung Thanh true
category tag author
bp2021
demo
nlp
Daniel Hladek

Than Trung Thanh

Bakalársky projekt 2020

Rozpoznávanie pomenovaných entít v slovenskom jazyku

Predbežné zadanie:

  • Vypracujte teoretický úvod, kde vysvetlíte čo je to rozpoznávanie pomenovaných entít a akými najnovšími metódami sa robí.
  • Vysvetlite, ako pracuje klasifikátor pre rozpoznávanie pomenovaných entít v knižnici Spacy .
  • Pomocou nástroja Prodigy anotujte dostatočné množstvo textu pre výskyt pomenovaných entít.
  • Pomocou nástroja Spacy vytvorte a vyhodnoťte model pre rozpoznávanie pomenovaných entít v slovenčine.
  • Zistite, ako Vami anotované dáta zlepšili presnosť vytvoreného modelu.

Osobné stretnutie 23.9.2020

Ciel je práce je zlepšiť presnosť rozpoznávania pomenovaných entít pre slovenský jazyk. Presnosť je možné zlepšiť pomocou nových trénovacích dát alebo pomocou zlepšenia procesu trénovania.

Stretnutie 28.1.2020:

Stav:

  • Preštudované Spacy a Prodigy.
  • Pokus o spracovanie XML dump Wikipédia.
  • Prečítané blogy.
  • Urobená prezentácia.
  • Natrénovaný model.

Úlohy:

  • Začať pracovať na písomnej časti. Prečítajte si niekoľko nových odborných článkov a napíšte čo ste sa dozvedeli na minimálne 4 strany.

Úlohy do ďalšieho stretnutia:

Dalšie stretnutie odporúčam o 2 týždne.

Konzultácie sa budú konakť minimálne raz za dva týždne, menej ako 6 konzutácií za semester je dôvodom pre zníženie hodnotenia semester je dôvodom pre zníženie hodnotenia alebo neudelenie zápočtu.alebo neudelenie zápočtu.