forked from KEMT/zpwiki
Update 'pages/students/2019/filip_tomas/README.md'
This commit is contained in:
parent
e429df9a83
commit
71ca8d8e55
@ -11,15 +11,11 @@ rok začiatku štúdia: 2019
|
||||
|
||||
# Diplomová práca 2024
|
||||
|
||||
Úloha:
|
||||
Ciel:
|
||||
|
||||
- Vytvorte distribuovaný vyhľadávací index pre dáta zo slovenského internetu. Cieľom je vytvoriť vyhľadávanie na (skoro) celom slovenskom internete.
|
||||
- Môžete vyskúšať aj "klasickú" databázu (BM25).
|
||||
- Použite vektorovú databázu s podporou ukladania textu.
|
||||
- Preskúmajte možnosti nasadenia QDRANT a MILVUS.
|
||||
- Vykonajte záťažové testy pre indexovanie a vyhľadávanie
|
||||
|
||||
Spolupráca Michal Stromko
|
||||
Spolupráca Michal Stromko, Kristián Sopkovič.
|
||||
|
||||
Stretnutie 26.10.2023
|
||||
|
||||
@ -29,6 +25,18 @@ Stav:
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Pozrite si profily Stromko, Sopkovič.
|
||||
- Zistite, ako funguje "vektorové" vyhľadávanie pomocou neurónových sietí. Ako funguje SBERT-SentenceTransformer? Ako funguje vyhľadávanie BM25? Nájdite články a napíšte poznámky na 3 strany.
|
||||
- Prečítajte si https://qdrant.tech/articles/hybrid-search/
|
||||
- Použite vektorovú databázu s podporou ukladania textu.
|
||||
- Preskúmajte možnosti nasadenia QDRANT, MILVUS, Weaviate. Oboznámte sa s týmito databázami. Vyberte jednu vhodnú na nasadenie v našich podmienkach. Mala by fungovať aj na RPI klastri, mala by podporovať aj hybridné vyhľadávanie.
|
||||
|
||||
Zásobník úloh:
|
||||
|
||||
- Zaindexujte slovenský internet.
|
||||
- Pripravte jednoduché webové rozhranie pre vyhľadávanie na slovenskom internete.
|
||||
- Vykonajte záťažové testy pre indexovanie a vyhľadávanie.
|
||||
|
||||
|
||||
|
||||
|
||||
|
Loading…
Reference in New Issue
Block a user