forked from KEMT/zpwiki
45 lines
1.4 KiB
Markdown
45 lines
1.4 KiB
Markdown
---
|
|
title: Ediz Morochovič
|
|
published: true
|
|
taxonomy:
|
|
category: [bp2019]
|
|
tag: [ner,nlp]
|
|
author: Daniel Hladek
|
|
---
|
|
# Ediz Morochovič
|
|
|
|
Rok začiatku štúdia: 2016
|
|
|
|
# Bakalárska práca 2019
|
|
|
|
Názov bakalárskej práce: Štatistické rozpoznávanie pomenovaných entít
|
|
|
|
Meno vedúceho: Ing. Daniel Hládek, PhD.
|
|
|
|
Zadanie bakalárskej práce:
|
|
1. Vypracujte prehľad štatistických metód identifikácie pomenovaných entít v texte.
|
|
2. Podrobne opíšte zvolenú metódu identifikácie pomenovaných entít v texte
|
|
3. Zvoľte si vhodnú metodiku vyhodnotenia a na vhodnej testovacej množine navrhnite a vykonajte sadu experimentov.
|
|
4. Na základe výsledkov experimentov navrhnite možné zlepšenia.
|
|
|
|
|
|
# Bakalársky projekt 2019
|
|
|
|
Úlohy:
|
|
Nainštalujte si prostredie Anaconda https://www.anaconda.com/
|
|
Oboznámiť sa so zvoleným štatistickým systémom pre rozpoznávanie pomenovaných entít (https://www.nltk.org/), https://www.nltk.o/install.html, https://stanfordnlp.github.io/CoreNLP/, https://www.nltk.org/book/
|
|
Zistite použitú štatistickú metódu a podrobne ju opíšte
|
|
Vypracujte prehľad používaných štatistických metód (maximum entropy, conditional random fields, hidden markov models), min. 5 strán s min. 10 odkazmi na odborné články
|
|
Navrhnite experimenty a vykonajte ich s rôznymi parametrami systému
|
|
|
|
|
|
Písomná práca :
|
|
|
|
Výstupy bakalárskeho projektu:
|
|
|
|
|
|
|
|
Poznámky:
|
|
|
|
|