From ad6fb599c6ab244d4947c9a80e053e0a24600a97 Mon Sep 17 00:00:00 2001 From: dano Date: Fri, 23 Dec 2022 11:55:10 +0000 Subject: [PATCH] Update 'pages/students/2019/kristian_sopkovic/README.md' --- pages/students/2019/kristian_sopkovic/README.md | 6 ++++++ 1 file changed, 6 insertions(+) diff --git a/pages/students/2019/kristian_sopkovic/README.md b/pages/students/2019/kristian_sopkovic/README.md index 6c8c63d5c..a7015e6ff 100644 --- a/pages/students/2019/kristian_sopkovic/README.md +++ b/pages/students/2019/kristian_sopkovic/README.md @@ -31,6 +31,12 @@ Námety na tému: - Natrénujte alebo dotrénujte Sentence Transformer Model, alebo iný model pre sémantícké vyhľadávanie. Aké sú potrebné databázy? Je možné dotrénovať multilinguálny model? - Vytvorte databázu pre trénovanie SBERT. Strojový preklad, existujúcej NLI databázy, Semantic Textual Similarity databázy. Alebo ak získame grant, tak vytvoríme "originálnu" (klon) slovenskú databázu. + +[Slovak Semantic Textual Similarity Benchmark](https://huggingface.co/datasets/crabz/stsb-sk) +na trénovanie Sentence Transformer. + + + Stretnutie 24.11. Úlohy: