From 75f985b727b8fcb519358e976ad30bf7b6388188 Mon Sep 17 00:00:00 2001 From: dano Date: Fri, 3 Feb 2023 10:20:10 +0000 Subject: [PATCH] Update 'pages/students/2019/michal_stromko/README.md' --- pages/students/2019/michal_stromko/README.md | 16 ++++++++++++++++ 1 file changed, 16 insertions(+) diff --git a/pages/students/2019/michal_stromko/README.md b/pages/students/2019/michal_stromko/README.md index cb8369f89..dc738a366 100644 --- a/pages/students/2019/michal_stromko/README.md +++ b/pages/students/2019/michal_stromko/README.md @@ -26,6 +26,22 @@ Ciele DP: - Dotrénovať slovenský ST model. - Porovnať viacero metód na vyhľadávanie v slovenskom texte - BM25, TF IDF, WordEmbedding, SentenceTransformers, Alebo iné embeddingy. +# Diplomovy projekt 1 + + +Ciele na semester (spoliu s K. Sopkovicom) + +- Chceme rozbehat demoo vyhladavanie. Existuje streamlit verzia. +- Chceme natrénovať a vyhodbnotiť model pre sémantické vyhľadávanie. Existuje prvá verzia sentence transformera (Cross Encoder, Dual Encoder natrénovaná na SK QUAD. Porovnať s STS SlovakBERT. +- Chceme využiť aj QA model - využiť ho v deme. +- Chcemem vyhodnotiť výkonnosť celého systému - všetky komponenty naraz. Aké sú možné metriky. +- Vypracovať prehľad metód na vyhodnotenie IR systémov a kompletných systémov QA. +- Preskúmať možnosti zlepšenia - Sentence Transformer skripty pre doménovú adaptáciu a multilinguálne modely. +- Vypracovať prehľad článkov, ktoré riešia kompletné sémantické vyhľadávanie. +- Podrobne opísať proces fungovania a trénovanie sentence transformera. Princíp dual-encoder, cross-encoder. +- Pripraviť multi-lingual experiment na vyhľadávanie, napr. Angličtina, Slovenčina, Nemčina. + + # Vedecky projekt 2022/23