diff --git a/pages/students/2019/michal_stromko/README.md b/pages/students/2019/michal_stromko/README.md index e169e3834..c70068bcd 100644 --- a/pages/students/2019/michal_stromko/README.md +++ b/pages/students/2019/michal_stromko/README.md @@ -29,9 +29,9 @@ Ciele DP: # Diplomovy projekt 1 -Ciele na semester (spoliu s K. Sopkovicom) +Ciele na semester (spolu s K. Sopkovicom) -- Chceme rozbehat demoo vyhladavanie. Existuje streamlit verzia. +- Chceme rozbehat demo vyhľadávanie. Existuje streamlit verzia. - Chceme natrénovať a vyhodbnotiť model pre sémantické vyhľadávanie. Existuje prvá verzia sentence transformera (Cross Encoder, Dual Encoder natrénovaná na SK QUAD. Porovnať s STS SlovakBERT. - Chceme využiť aj QA model - využiť ho v deme. - Chcemem vyhodnotiť výkonnosť celého systému - všetky komponenty naraz. Aké sú možné metriky. @@ -43,6 +43,20 @@ Ciele na semester (spoliu s K. Sopkovicom) - Pripraviť multi-lingual experiment na vyhľadávanie, napr. Angličtina, Slovenčina, Nemčina. +Stretnutie 17.2.2022 + +Úlohy: + +- Zoberte existujúci model bi-encoder. Indexujte všetky odseky do vektorovej databázy FAISS. +- Upravte streamlit demo na QA systém. Skript sa nachádza v slovak-retrieval/qademo. Skript bude vyhľadávať k najlepších dokumentov vektorovým vyhľadávaním. +- Potom v najlepších dokumentoch vykonajte QA vyhľadávanie. +- Zobrazte výsledky používateľovi. + +Zásobník úloh: + +- Pripravte experimenty, kde prezentujeme komponenty, porovnáme rôzne možnosti do podoby článku. + + # Vedecky projekt 2022/23