From 5210ba59898cc2906ae3f57e5a8b1a151605a651 Mon Sep 17 00:00:00 2001 From: Daniel Hladek Date: Thu, 24 Nov 2022 11:04:24 +0100 Subject: [PATCH] zz --- .../students/2019/kristian_sopkovic/README.md | 25 ++++++++++++++++++- 1 file changed, 24 insertions(+), 1 deletion(-) diff --git a/pages/students/2019/kristian_sopkovic/README.md b/pages/students/2019/kristian_sopkovic/README.md index 7a7ad314a..ebeb8c74b 100644 --- a/pages/students/2019/kristian_sopkovic/README.md +++ b/pages/students/2019/kristian_sopkovic/README.md @@ -2,13 +2,36 @@ title: Kristián Sopkovič published: true taxonomy: - category: [bp2022] + category: [bp2022,dp2024] tag: [spacy,nlp] author: Daniel Hladek --- rok začiatku štúdia: 2019 + +# Diplomová práca 2024 + +Súvisiace práce: Michal Stromko + +Cieľ je zlepšiť slovenské vyhľadávanie pomocou neurónových sietí. + +Námety na tému: + +- Natrénujte alebo dotrénujte Sentence Transformer Model, alebo iný model pre sémantícké vyhľadávanie. Aké sú potrebné databázy? Je možné dotrénovať multilinguálny model? +- Vytvorte databázu pre trénovanie SBERT. Strojový preklad, existujúcej NLI databázy, Semantic Textual Similarity databázy. Alebo ak získame grant, tak vytvoríme "originálnu" (klon) slovenskú databázu. + +Stretnutie 24.11. + +Úlohy: + +- Porozmýľať ďalej o téme, komuikovať o možnom grante na anotáciu. +- Vyskúšajte [Sentence Transformers framework](https://github.com/UKPLab/sentence-transformers/tree/master/examples). Pozrite si príklady, ako trénovať. +- Prečítajte si článok https://arxiv.org/abs/1908.10084. +- Zistite, čo je Natural Language Inference, aké sú dostupné databázy. +- Zistite, čo je Semantic Textual Similarity, aké sú dostupné databázy. +- Pozrite si https://git.kemt.fei.tuke.sk/dano/slovakretrieval/ + # Bakalárska práca 2022 Návrh na názov bakalárkej práce: