Update 'pages/students/2019/filip_tomas/README.md'

This commit is contained in:
dano 2023-10-26 11:54:52 +00:00
parent e429df9a83
commit 71ca8d8e55

View File

@ -11,15 +11,11 @@ rok začiatku štúdia: 2019
# Diplomová práca 2024
Úloha:
Ciel:
- Vytvorte distribuovaný vyhľadávací index pre dáta zo slovenského internetu. Cieľom je vytvoriť vyhľadávanie na (skoro) celom slovenskom internete.
- Môžete vyskúšať aj "klasickú" databázu (BM25).
- Použite vektorovú databázu s podporou ukladania textu.
- Preskúmajte možnosti nasadenia QDRANT a MILVUS.
- Vykonajte záťažové testy pre indexovanie a vyhľadávanie
Spolupráca Michal Stromko
Spolupráca Michal Stromko, Kristián Sopkovič.
Stretnutie 26.10.2023
@ -29,6 +25,18 @@ Stav:
Úlohy:
- Pozrite si profily Stromko, Sopkovič.
- Zistite, ako funguje "vektorové" vyhľadávanie pomocou neurónových sietí. Ako funguje SBERT-SentenceTransformer? Ako funguje vyhľadávanie BM25? Nájdite články a napíšte poznámky na 3 strany.
- Prečítajte si https://qdrant.tech/articles/hybrid-search/
- Použite vektorovú databázu s podporou ukladania textu.
- Preskúmajte možnosti nasadenia QDRANT, MILVUS, Weaviate. Oboznámte sa s týmito databázami. Vyberte jednu vhodnú na nasadenie v našich podmienkach. Mala by fungovať aj na RPI klastri, mala by podporovať aj hybridné vyhľadávanie.
Zásobník úloh:
- Zaindexujte slovenský internet.
- Pripravte jednoduché webové rozhranie pre vyhľadávanie na slovenskom internete.
- Vykonajte záťažové testy pre indexovanie a vyhľadávanie.