From 4e988eb1d56f78e55d716da420814a355dec426f Mon Sep 17 00:00:00 2001 From: dano Date: Thu, 10 Nov 2022 09:20:46 +0000 Subject: [PATCH] Update 'pages/students/2019/michal_stromko/README.md' --- pages/students/2019/michal_stromko/README.md | 10 +++++++++- 1 file changed, 9 insertions(+), 1 deletion(-) diff --git a/pages/students/2019/michal_stromko/README.md b/pages/students/2019/michal_stromko/README.md index 3fc49a3c..588f7c11 100644 --- a/pages/students/2019/michal_stromko/README.md +++ b/pages/students/2019/michal_stromko/README.md @@ -18,8 +18,11 @@ Návrh na zadanie diplomovej práce: - S vybranou metódou vykonajte experiment s vyhľadávaním. Metódu porovnajte s najmenej jednou inou metódou. - Vyhodnoťte experimenty a identifikujte slabé miesta a navrhnite zlepšenia. +Ciele DP: -Bolo by fajn, keby z DP bol vedecký článok. +- Bolo by fajn, keby z DP bol vedecký článok. +- Dotrénovať slovenský ST model. +- Porovnať viacero metód na vyhľadávanie v slovenskom texte - BM25, TF IDF, WordEmbedding, SentenceTransformers, Alebo iné embeddingy. Súvisiace práce: @@ -48,6 +51,11 @@ Klucove slova: Stretnutie 10.11.2022 +Stav: + +- Konvertovaný SCNC do JSON. +- Práca s Jina-Elasticsearch pre uloženie embeddingov. + Zasobnik uloh: - Rozbehať skript SlovakRetrieval ktorý využíva FAISS. V skripte je už aj BM25, ostatné modely aj vyhodnotenie Recall na množine SK QUAD.