diff --git a/pages/students/2019/filip_tomas/README.md b/pages/students/2019/filip_tomas/README.md index e81f9715df..ec9d62589b 100644 --- a/pages/students/2019/filip_tomas/README.md +++ b/pages/students/2019/filip_tomas/README.md @@ -11,15 +11,11 @@ rok začiatku štúdia: 2019 # Diplomová práca 2024 -Úloha: +Ciel: - Vytvorte distribuovaný vyhľadávací index pre dáta zo slovenského internetu. Cieľom je vytvoriť vyhľadávanie na (skoro) celom slovenskom internete. -- Môžete vyskúšať aj "klasickú" databázu (BM25). -- Použite vektorovú databázu s podporou ukladania textu. -- Preskúmajte možnosti nasadenia QDRANT a MILVUS. -- Vykonajte záťažové testy pre indexovanie a vyhľadávanie -Spolupráca Michal Stromko +Spolupráca Michal Stromko, Kristián Sopkovič. Stretnutie 26.10.2023 @@ -29,7 +25,19 @@ Stav: Úlohy: - +- Pozrite si profily Stromko, Sopkovič. +- Zistite, ako funguje "vektorové" vyhľadávanie pomocou neurónových sietí. Ako funguje SBERT-SentenceTransformer? Ako funguje vyhľadávanie BM25? Nájdite články a napíšte poznámky na 3 strany. +- Prečítajte si https://qdrant.tech/articles/hybrid-search/ +- Použite vektorovú databázu s podporou ukladania textu. +- Preskúmajte možnosti nasadenia QDRANT, MILVUS, Weaviate. Oboznámte sa s týmito databázami. Vyberte jednu vhodnú na nasadenie v našich podmienkach. Mala by fungovať aj na RPI klastri, mala by podporovať aj hybridné vyhľadávanie. + +Zásobník úloh: + +- Zaindexujte slovenský internet. +- Pripravte jednoduché webové rozhranie pre vyhľadávanie na slovenskom internete. +- Vykonajte záťažové testy pre indexovanie a vyhľadávanie. + + # Diplomový projekt 2023