diff --git a/pages/students/2019/michal_stromko/README.md b/pages/students/2019/michal_stromko/README.md index 3fc49a3c2a..588f7c1181 100644 --- a/pages/students/2019/michal_stromko/README.md +++ b/pages/students/2019/michal_stromko/README.md @@ -18,8 +18,11 @@ Návrh na zadanie diplomovej práce: - S vybranou metódou vykonajte experiment s vyhľadávaním. Metódu porovnajte s najmenej jednou inou metódou. - Vyhodnoťte experimenty a identifikujte slabé miesta a navrhnite zlepšenia. +Ciele DP: -Bolo by fajn, keby z DP bol vedecký článok. +- Bolo by fajn, keby z DP bol vedecký článok. +- Dotrénovať slovenský ST model. +- Porovnať viacero metód na vyhľadávanie v slovenskom texte - BM25, TF IDF, WordEmbedding, SentenceTransformers, Alebo iné embeddingy. Súvisiace práce: @@ -48,6 +51,11 @@ Klucove slova: Stretnutie 10.11.2022 +Stav: + +- Konvertovaný SCNC do JSON. +- Práca s Jina-Elasticsearch pre uloženie embeddingov. + Zasobnik uloh: - Rozbehať skript SlovakRetrieval ktorý využíva FAISS. V skripte je už aj BM25, ostatné modely aj vyhodnotenie Recall na množine SK QUAD.