# Ediz Morochovič Rok začiatku štúdia: 2016 # Bakalárska práca 2019 Názov bakalárskej práce: Štatistické rozpoznávanie pomenovaných entít Meno vedúceho: Ing. Daniel Hládek, PhD. Zadanie bakalárskej práce: 1. Vypracujte prehľad štatistických metód identifikácie pomenovaných entít v texte. 2. Podrobne opíšte zvolenú metódu identifikácie pomenovaných entít v texte 3. Zvoľte si vhodnú metodiku vyhodnotenia a na vhodnej testovacej množine navrhnite a vykonajte sadu experimentov. 4. Na základe výsledkov experimentov navrhnite možné zlepšenia. # Bakalársky projekt 2019 Úlohy: Nainštalujte si prostredie Anaconda https://www.anaconda.com/ Oboznámiť sa so zvoleným štatistickým systémom pre rozpoznávanie pomenovaných entít (https://www.nltk.org/), https://www.nltk.o/install.html, https://stanfordnlp.github.io/CoreNLP/, https://www.nltk.org/book/ Zistite použitú štatistickú metódu a podrobne ju opíšte Vypracujte prehľad používaných štatistických metód (maximum entropy, conditional random fields, hidden markov models), min. 5 strán s min. 10 odkazmi na odborné články Navrhnite experimenty a vykonajte ich s rôznymi parametrami systému Písomná práca : Výstupy bakalárskeho projektu: Poznámky: