diff --git a/pages/students/2019/kristian_sopkovic/README.md b/pages/students/2019/kristian_sopkovic/README.md index 7a7ad314ac..ebeb8c74b0 100644 --- a/pages/students/2019/kristian_sopkovic/README.md +++ b/pages/students/2019/kristian_sopkovic/README.md @@ -2,13 +2,36 @@ title: Kristián Sopkovič published: true taxonomy: - category: [bp2022] + category: [bp2022,dp2024] tag: [spacy,nlp] author: Daniel Hladek --- rok začiatku štúdia: 2019 + +# Diplomová práca 2024 + +Súvisiace práce: Michal Stromko + +Cieľ je zlepšiť slovenské vyhľadávanie pomocou neurónových sietí. + +Námety na tému: + +- Natrénujte alebo dotrénujte Sentence Transformer Model, alebo iný model pre sémantícké vyhľadávanie. Aké sú potrebné databázy? Je možné dotrénovať multilinguálny model? +- Vytvorte databázu pre trénovanie SBERT. Strojový preklad, existujúcej NLI databázy, Semantic Textual Similarity databázy. Alebo ak získame grant, tak vytvoríme "originálnu" (klon) slovenskú databázu. + +Stretnutie 24.11. + +Úlohy: + +- Porozmýľať ďalej o téme, komuikovať o možnom grante na anotáciu. +- Vyskúšajte [Sentence Transformers framework](https://github.com/UKPLab/sentence-transformers/tree/master/examples). Pozrite si príklady, ako trénovať. +- Prečítajte si článok https://arxiv.org/abs/1908.10084. +- Zistite, čo je Natural Language Inference, aké sú dostupné databázy. +- Zistite, čo je Semantic Textual Similarity, aké sú dostupné databázy. +- Pozrite si https://git.kemt.fei.tuke.sk/dano/slovakretrieval/ + # Bakalárska práca 2022 Návrh na názov bakalárkej práce: