zpwiki/pages/students/2016/jan_holp/README.md

65 lines
2.1 KiB
Markdown

# Ján Holp
*Rok začiatku štúdia*: 2016
![Moja mačka](maxresdefault.jpg)
## Diplomová práca 2021
*Názov diplomovej práce*: Napíšte názov diplomovej práce
*Meno vedúceho*: Ing. Daniel Hládek, PhD.
*Zadanie diplomovej práce*:
- Vypracujte prehľad metód ohodnotenia dokumentov v systémoch získavania informácií
- Implementujte jednoduchý systém pre získavanie informácií v slovenskom jazyku, v ktorom využijete ohodnotenie dokumentov.
- Navrhnite a vypracujte experimenty, v ktorých vyhodnotíte vybrané metódy odhodnotenia dokumentov
- Navrhnite možné zlepšenia presnosti vyhľadávania
## Tímový projekt 2019
*Písomná práca* : [Rešerš](./timovy_projekt)
*Úlohy tímového projektu*:
- Vypracujte min. 4 stranový abstrakt z knihy "Hang Li: Learning to Rank for Information Retrieval and Natural Language Processing"
- Sústreďte sa najprv na algoritmus PageRank a BM25
- citujte 10 najvýznamnejších bibliografických zdrojov
### Poznámky k vypracovaniu DP
- možnosť pracovať s veľkými dátami Elasticsearch, je nutné sprevádzkovať ES Cluster.
- možnosť vypracovať jednoduché demo web vyhľadávača
- inšpirácia Agent pre získavanie textu "dano/websucker"
- Pozrite si Python knižnice pre elasticsearch, a information retrieval (pagerank a pod.)
## Bakalárska práca 2019
*Meno vedúceho*: Ing. Daniel Hládek, PhD.
*Názov bakalárskej práce*: Vyhľadávač na slovenskom internete
*Text bakalárskej práce*: (https://opac.crzp.sk/?fn=detailBiblioForm&sid=A4CA3C451D400D4BD034603141D1)
*Zadanie bakalárskej práce*:
1. Zostaviť prehľad aktuálnych metód vyhľadávania v textových dátach a metód vyhodnotenia presnosti.
2. Navrhnúť a opísať vlastnú metódu indexovania a vyhľadávania v slovenskom texte.
3. Navrhnúť a vykonať sadu experimentov pomocou ktorých sa vyhodnotí navrhnutá metóda indexovania a vyhľadávania.
4. Na základe experimentov navrhnúť vylepšenia navrhnutej metódy vyhľadávania.
[Bakalárska práca 2018 - Vyhľadávač na slovenskom internete](https://opac.crzp.sk/?fn=detailBiblioForm&sid=A4CA3C451D400D4BD034603141D1)