This commit is contained in:
Daniel Hládek 2021-09-24 10:09:56 +02:00
parent 37f485c922
commit b666d78720

View File

@ -9,6 +9,44 @@ taxonomy:
rok začiatku štúdia: 2019 rok začiatku štúdia: 2019
# Bakalárska 2022
Názov: Indexovanie slovenského textu
1. Vypracujte prehľad metód pre získavanie informácií.
2. Vytvorte vyhľadávací index dokumentov zo slovenského internetu.
3. Vytvorte demonštračnú webovú aplikáciu pre vyhľadávanie na slovenskom internete.
4. Navrhnite zlepšenia vyhľadávania.
## Bakalársky projekt 2021
Ciele na semester:
- vedieť zaindexovať väčšie množstvo slovenských textov.
- vytvoriť funkčné webové demo na vyhľadávanie v týchto textoch.
Stretnutie 24.9.2021:
Stav:
- Urobené poznámku ku knihe "Learning to Rank".
- Naštudované Cassandra.
Úlohy:
- Kódy dávajte na GIT do repozitára bp2022
- Začnite pracovať na Flask Web aplikácii. Aplikácia by mala vedieť zadať dotaz a zobraziť výsledky vyhľadávania.
- Vytvorte skript na indexovanie wikipédie do ES
- Napíšte si osnovu bakalárskej práce a dopíšte do nej relevantné texty ktoré máte.
Zásobník úloh:
- Vytvorte si virtuálny stroj na cloud.tuke.sk
- Web aplikácia by mala byť Dockerizovaná - vytvoríme Docker image.
- Vytvorte si pracovné prostredie s ElasticSearch a docker-compose: nainštalujete Docker Swarm
## Vedecký projekt 2021 ## Vedecký projekt 2021
Návrh na zadanie bakalárskej práce: Návrh na zadanie bakalárskej práce:
@ -55,10 +93,6 @@ Do budúcnosti:
- Zaindexovať texty - Zaindexovať texty
- Vytvoriť webové rozhranie pre vyhľadávací index. - Vytvoriť webové rozhranie pre vyhľadávací index.
Stretnutie 7.5. Stretnutie 7.5.
Stav: Stav: