From b06eb9c21c409e36a973bf06f6a35d7d08555bc3 Mon Sep 17 00:00:00 2001 From: dano Date: Tue, 23 Jul 2024 12:10:24 +0000 Subject: [PATCH] Update 'pages/students/2019/filip_tomas/README.md' --- pages/students/2019/filip_tomas/README.md | 29 +++++++++++++++++++++-- 1 file changed, 27 insertions(+), 2 deletions(-) diff --git a/pages/students/2019/filip_tomas/README.md b/pages/students/2019/filip_tomas/README.md index 2d918b2d..29649e24 100644 --- a/pages/students/2019/filip_tomas/README.md +++ b/pages/students/2019/filip_tomas/README.md @@ -12,7 +12,7 @@ rok začiatku štúdia: 2019 DP sa prekladá na rok 2025 -# Diplomová práca 2024 +# Diplomová práca 2024 - 2025 Zadanie: @@ -28,7 +28,32 @@ Ciel: Spolupráca Michal Stromko, Kristián Sopkovič. -Stretnutie 3.5.2023 +Stretnutie 23.7.2024 + +Stav: + +- Vytvorený jednoduchý index pomocou Milvus, indexovanie pomocou slovakbert-mnlr. +- Zatiaľ slovakbert-mnlr vyzerá lepšie, ale treba to ešte vyskúšať. + +Úlohy: + +- Pokračujte pri vytváraní indexu pomocou Milvus- slovakbert-mnlr. Snažte sa zindexovať celú wikipédiu. Indexujte na úrovni odstavcov. Na uloženie textu môžete použiť súborový systém (urobte si funkciu ktorá namapuje ID na meno súboru). Alebo na uloženie použite databázu. Napríklad minio alebo sqlite. +- Skripty dávajte na GIT. +- Oboznámte sa s knižnicou LangChain, začnite tu https://python.langchain.com/v0.2/docs/tutorials/retrievers/ +- robte si písomné poznámky. študujte vedecké články (napr. z Arxiv). Odkaz na článok si poznačte a zapíšte si čo sa v článku píše. + + +Zásobník úloh: + +- vyhľadávací systém môžete urobiť pomocou langchain alebo inej knižnice. +- Pripravte deployment navrhnutého systému na k8s klaster. +- skúste spustiť vyhľadávací systém na raspberry pi klastri. +- zaindexujte slovenský internet. +- Pripravte benchmark rýchlosti indexovania. +- Pripravte webové rozhranie pre vyhľadávanie. + + +Stretnutie 3.5.2024 Stav: