forked from KEMT/zpwiki
Add 'pages/students/2016/jan_holpREADME.md'
This commit is contained in:
parent
9202e16b2a
commit
3a50860e0e
25
pages/students/2016/jan_holpREADME.md
Normal file
25
pages/students/2016/jan_holpREADME.md
Normal file
@ -0,0 +1,25 @@
|
|||||||
|
# Ján Holp
|
||||||
|
|
||||||
|
[Bakalárska práca 2018 - Vyhľadávač na slovenskom internete](https://opac.crzp.sk/?fn=detailBiblioForm&sid=A4CA3C451D400D4BD034603141D1)
|
||||||
|
|
||||||
|
## Tímový projekt 2019
|
||||||
|
|
||||||
|
- Vypracujte min. 4 stranový abstrakt z knihy "Hang Li: Learning to Rank for Information Retrieval and Natural Language Processing"
|
||||||
|
- Sústreďte sa najprv na algoritmus PageRank a BM25
|
||||||
|
- citujte 10 najvýznamnejších bibliografických zdrojov
|
||||||
|
|
||||||
|
|
||||||
|
## Návrh na zadanie DP
|
||||||
|
|
||||||
|
- Vypracujte prehľad metód ohodnotenia dokumentov v systémoch získavania informácií
|
||||||
|
- Implementujte jednoduchý systém pre získavanie informácií v slovenskom jazyku, v ktorom využijete ohodnotenie dokumentov.
|
||||||
|
- Navrhnite a vypracujte experimenty, v ktorých vyhodnotíte vybrané metódy odhodnotenia dokumentov
|
||||||
|
- Navrhnite možné zlepšenia presnosti vyhľadávania
|
||||||
|
|
||||||
|
## Poznámky k vypracovaniu DP
|
||||||
|
|
||||||
|
- možnosť pracovať s veľkými dátami Elasticsearch, je nutné sprevádzkovať ES Cluster.
|
||||||
|
- možnosť vypracovať jednoduché demo web vyhľadávača
|
||||||
|
- inšpirácia Agent pre získavanie textu "dano/websucker"
|
||||||
|
- Pozrite si Python knižnice pre elasticsearch, a information retrieval (pagerank a pod.)
|
||||||
|
|
Loading…
Reference in New Issue
Block a user