From 01bbdbd87174d508f3238d2e64fe4f70fbe9ae8c Mon Sep 17 00:00:00 2001 From: dano Date: Thu, 10 Nov 2022 09:25:17 +0000 Subject: [PATCH] Update 'pages/students/2019/michal_stromko/README.md' --- pages/students/2019/michal_stromko/README.md | 8 +++++++- 1 file changed, 7 insertions(+), 1 deletion(-) diff --git a/pages/students/2019/michal_stromko/README.md b/pages/students/2019/michal_stromko/README.md index 588f7c118..8858e89a2 100644 --- a/pages/students/2019/michal_stromko/README.md +++ b/pages/students/2019/michal_stromko/README.md @@ -55,11 +55,17 @@ Stav: - Konvertovaný SCNC do JSON. - Práca s Jina-Elasticsearch pre uloženie embeddingov. +- Prečítaný a spoznámkovaný článok "Making Monolingual Sentence Embeddings Multilingual using Knowledge Distillation". -Zasobnik uloh: +Úlohy: - Rozbehať skript SlovakRetrieval ktorý využíva FAISS. V skripte je už aj BM25, ostatné modely aj vyhodnotenie Recall na množine SK QUAD. - Vytvoriť slovenské vyhľadávanie pomocou WordEmbeding. Použiť slovenský Spacy Model. +- Prečítať a spoznámkovať ďalšie články z https://github.com/UKPLab/sentence-transformers + + +Zasobnik uloh: + - Dotrénovať sentence transformer na slovenský jazyk. Ako? Stretnutie 14.10.2022