diff --git a/pages/students/2019/michal_stromko/README.md b/pages/students/2019/michal_stromko/README.md index cb8369f890..dc738a3669 100644 --- a/pages/students/2019/michal_stromko/README.md +++ b/pages/students/2019/michal_stromko/README.md @@ -26,6 +26,22 @@ Ciele DP: - Dotrénovať slovenský ST model. - Porovnať viacero metód na vyhľadávanie v slovenskom texte - BM25, TF IDF, WordEmbedding, SentenceTransformers, Alebo iné embeddingy. +# Diplomovy projekt 1 + + +Ciele na semester (spoliu s K. Sopkovicom) + +- Chceme rozbehat demoo vyhladavanie. Existuje streamlit verzia. +- Chceme natrénovať a vyhodbnotiť model pre sémantické vyhľadávanie. Existuje prvá verzia sentence transformera (Cross Encoder, Dual Encoder natrénovaná na SK QUAD. Porovnať s STS SlovakBERT. +- Chceme využiť aj QA model - využiť ho v deme. +- Chcemem vyhodnotiť výkonnosť celého systému - všetky komponenty naraz. Aké sú možné metriky. +- Vypracovať prehľad metód na vyhodnotenie IR systémov a kompletných systémov QA. +- Preskúmať možnosti zlepšenia - Sentence Transformer skripty pre doménovú adaptáciu a multilinguálne modely. +- Vypracovať prehľad článkov, ktoré riešia kompletné sémantické vyhľadávanie. +- Podrobne opísať proces fungovania a trénovanie sentence transformera. Princíp dual-encoder, cross-encoder. +- Pripraviť multi-lingual experiment na vyhľadávanie, napr. Angličtina, Slovenčina, Nemčina. + + # Vedecky projekt 2022/23