diff --git a/pages/students/2019/michal_stromko/README.md b/pages/students/2019/michal_stromko/README.md index 588f7c1181..8858e89a23 100644 --- a/pages/students/2019/michal_stromko/README.md +++ b/pages/students/2019/michal_stromko/README.md @@ -55,11 +55,17 @@ Stav: - Konvertovaný SCNC do JSON. - Práca s Jina-Elasticsearch pre uloženie embeddingov. +- Prečítaný a spoznámkovaný článok "Making Monolingual Sentence Embeddings Multilingual using Knowledge Distillation". -Zasobnik uloh: +Úlohy: - Rozbehať skript SlovakRetrieval ktorý využíva FAISS. V skripte je už aj BM25, ostatné modely aj vyhodnotenie Recall na množine SK QUAD. - Vytvoriť slovenské vyhľadávanie pomocou WordEmbeding. Použiť slovenský Spacy Model. +- Prečítať a spoznámkovať ďalšie články z https://github.com/UKPLab/sentence-transformers + + +Zasobnik uloh: + - Dotrénovať sentence transformer na slovenský jazyk. Ako? Stretnutie 14.10.2022