From 4eaf7195631c6375d70a0b64b502d7478cf418d1 Mon Sep 17 00:00:00 2001 From: dano Date: Mon, 27 Mar 2023 08:01:44 +0000 Subject: [PATCH] Update 'pages/students/2019/michal_stromko/README.md' --- pages/students/2019/michal_stromko/README.md | 21 +++++++++++++++++--- 1 file changed, 18 insertions(+), 3 deletions(-) diff --git a/pages/students/2019/michal_stromko/README.md b/pages/students/2019/michal_stromko/README.md index d8ccc587..2304aa53 100644 --- a/pages/students/2019/michal_stromko/README.md +++ b/pages/students/2019/michal_stromko/README.md @@ -43,13 +43,28 @@ Nápady na semester (spolu s K. Sopkovicom) - Pripraviť multi-lingual experiment na vyhľadávanie, napr. Angličtina, Slovenčina, Nemčina. - Vyskúšať vyhľadávanie v inej doméne (noviny, mestské dokumenty). +Stretnutie 27.3.2023 + +Stav: + +- Jednoduché demo stremalit fuguje - vektorové vyhľadávanie pomocou transformers utils.semantic_search. +- Cieľ: ku každému paragrafu vypočítať embedding pomocou mnlr. Poznačiť si dokument id. V prvom kroku ku otázke vyhľadať paragrafy. V druhom kroku ku otázke vyhľadať odpovede v paragrafoch. V treťom kroku zobraziť odpoveď na otázku aj najrelevantnejšie dokumenty. +- Pokračovať v písomnej časti. + +Zásobník úloh: + +- util_semanticsearch vymentiť za qdrant alebo faiss alebo iné. +- Určiť prah, na základe ktorého sa zistí, že odpoveď nie je v databáze. +- Neskôr dorobiť "fallback" na "fuzzy" vyhľadávanie relevatných dokumentov. + + Stretnutie 20.2.2023 Úlohy: -- Spravte QA demo pomocou streamlit. Najprv vytvorte faiss index, do pamäte nahrajte všetky paragrafy. -- Dotaz transformuje na vektor. Nájdite 5 najlepších odsekov. Vykonajte QA na všety odseky. Zobrazte odseky. Zobrazte najlepšiu odpoveď a názov dokumentu kde sa nachádza. -- Modely sa nachádzajú na HF TUKE-DeutscheTelekom. +- [-] Spravte QA demo pomocou streamlit. Najprv vytvorte faiss index, do pamäte nahrajte všetky paragrafy. +- [ ] Dotaz transformuje na vektor. Nájdite 5 najlepších odsekov. Vykonajte QA na všety odseky. Zobrazte odseky. Zobrazte najlepšiu odpoveď a názov dokumentu kde sa nachádza. +- [ ] Modely sa nachádzajú na HF TUKE-DeutscheTelekom. Zásobník: