From 3466cae6840505b5c452fb965f84c6d7c2939450 Mon Sep 17 00:00:00 2001 From: dano Date: Fri, 17 Feb 2023 08:46:10 +0000 Subject: [PATCH] Update 'pages/students/2019/michal_stromko/README.md' --- pages/students/2019/michal_stromko/README.md | 18 ++++++++++++++++-- 1 file changed, 16 insertions(+), 2 deletions(-) diff --git a/pages/students/2019/michal_stromko/README.md b/pages/students/2019/michal_stromko/README.md index e169e3834..c70068bcd 100644 --- a/pages/students/2019/michal_stromko/README.md +++ b/pages/students/2019/michal_stromko/README.md @@ -29,9 +29,9 @@ Ciele DP: # Diplomovy projekt 1 -Ciele na semester (spoliu s K. Sopkovicom) +Ciele na semester (spolu s K. Sopkovicom) -- Chceme rozbehat demoo vyhladavanie. Existuje streamlit verzia. +- Chceme rozbehat demo vyhľadávanie. Existuje streamlit verzia. - Chceme natrénovať a vyhodbnotiť model pre sémantické vyhľadávanie. Existuje prvá verzia sentence transformera (Cross Encoder, Dual Encoder natrénovaná na SK QUAD. Porovnať s STS SlovakBERT. - Chceme využiť aj QA model - využiť ho v deme. - Chcemem vyhodnotiť výkonnosť celého systému - všetky komponenty naraz. Aké sú možné metriky. @@ -43,6 +43,20 @@ Ciele na semester (spoliu s K. Sopkovicom) - Pripraviť multi-lingual experiment na vyhľadávanie, napr. Angličtina, Slovenčina, Nemčina. +Stretnutie 17.2.2022 + +Úlohy: + +- Zoberte existujúci model bi-encoder. Indexujte všetky odseky do vektorovej databázy FAISS. +- Upravte streamlit demo na QA systém. Skript sa nachádza v slovak-retrieval/qademo. Skript bude vyhľadávať k najlepších dokumentov vektorovým vyhľadávaním. +- Potom v najlepších dokumentoch vykonajte QA vyhľadávanie. +- Zobrazte výsledky používateľovi. + +Zásobník úloh: + +- Pripravte experimenty, kde prezentujeme komponenty, porovnáme rôzne možnosti do podoby článku. + + # Vedecky projekt 2022/23