Spolupráca na záverečných prácach https://zp.kemt.fei.tuke.sk
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
 
 
 
 
 
 

1.4 KiB

title published taxonomy
Ediz Morochovič true [{category [bp2019]} {tag [ner nlp]} {author Daniel Hladek}]

Ediz Morochovič

Rok začiatku štúdia: 2016

Bakalárska práca 2019

Názov bakalárskej práce: Štatistické rozpoznávanie pomenovaných entít

Meno vedúceho: Ing. Daniel Hládek, PhD.

Zadanie bakalárskej práce:

  1. Vypracujte prehľad štatistických metód identifikácie pomenovaných entít v texte.
  2. Podrobne opíšte zvolenú metódu identifikácie pomenovaných entít v texte
  3. Zvoľte si vhodnú metodiku vyhodnotenia a na vhodnej testovacej množine navrhnite a vykonajte sadu experimentov.
  4. Na základe výsledkov experimentov navrhnite možné zlepšenia.

Bakalársky projekt 2019

Úlohy: Nainštalujte si prostredie Anaconda https://www.anaconda.com/ Oboznámiť sa so zvoleným štatistickým systémom pre rozpoznávanie pomenovaných entít (https://www.nltk.org/), https://www.nltk.o/install.html, https://stanfordnlp.github.io/CoreNLP/, https://www.nltk.org/book/ Zistite použitú štatistickú metódu a podrobne ju opíšte Vypracujte prehľad používaných štatistických metód (maximum entropy, conditional random fields, hidden markov models), min. 5 strán s min. 10 odkazmi na odborné články Navrhnite experimenty a vykonajte ich s rôznymi parametrami systému

Písomná práca :

Výstupy bakalárskeho projektu:

Poznámky: