Názov bakalárskej práce: Štatistické rozpoznávanie pomenovaných entít
Meno vedúceho: Ing. Daniel Hládek, PhD.
Zadanie bakalárskej práce:
1.Vypracujte prehľad štatistických metód identifikácie pomenovaných entít v texte.
2. Podrobne opíšte zvolenú metódu identifikácie pomenovaných entít v texte
3. Zvoľte si vhodnú metodiku vyhodnotenia a na vhodnej testovacej množine navrhnite a vykonajte sadu experimentov.
4. Na základe výsledkov experimentov navrhnite možné zlepšenia.
# Bakalársky projekt 2019
Úlohy:
Nainštalujte si prostredie Anaconda https://www.anaconda.com/
Oboznámiť sa so zvoleným štatistickým systémom pre rozpoznávanie pomenovaných entít (https://www.nltk.org/), https://www.nltk.o/install.html, https://stanfordnlp.github.io/CoreNLP/, https://www.nltk.org/book/
Zistite použitú štatistickú metódu a podrobne ju opíšte
Vypracujte prehľad používaných štatistických metód (maximum entropy, conditional random fields, hidden markov models), min. 5 strán s min. 10 odkazmi na odborné články
Navrhnite experimenty a vykonajte ich s rôznymi parametrami systému