This commit is contained in:
Daniel Hládek 2022-11-24 11:04:24 +01:00
parent 5ed58223c3
commit 5210ba5989

View File

@ -2,13 +2,36 @@
title: Kristián Sopkovič title: Kristián Sopkovič
published: true published: true
taxonomy: taxonomy:
category: [bp2022] category: [bp2022,dp2024]
tag: [spacy,nlp] tag: [spacy,nlp]
author: Daniel Hladek author: Daniel Hladek
--- ---
rok začiatku štúdia: 2019 rok začiatku štúdia: 2019
# Diplomová práca 2024
Súvisiace práce: Michal Stromko
Cieľ je zlepšiť slovenské vyhľadávanie pomocou neurónových sietí.
Námety na tému:
- Natrénujte alebo dotrénujte Sentence Transformer Model, alebo iný model pre sémantícké vyhľadávanie. Aké sú potrebné databázy? Je možné dotrénovať multilinguálny model?
- Vytvorte databázu pre trénovanie SBERT. Strojový preklad, existujúcej NLI databázy, Semantic Textual Similarity databázy. Alebo ak získame grant, tak vytvoríme "originálnu" (klon) slovenskú databázu.
Stretnutie 24.11.
Úlohy:
- Porozmýľať ďalej o téme, komuikovať o možnom grante na anotáciu.
- Vyskúšajte [Sentence Transformers framework](https://github.com/UKPLab/sentence-transformers/tree/master/examples). Pozrite si príklady, ako trénovať.
- Prečítajte si článok https://arxiv.org/abs/1908.10084.
- Zistite, čo je Natural Language Inference, aké sú dostupné databázy.
- Zistite, čo je Semantic Textual Similarity, aké sú dostupné databázy.
- Pozrite si https://git.kemt.fei.tuke.sk/dano/slovakretrieval/
# Bakalárska práca 2022 # Bakalárska práca 2022
Návrh na názov bakalárkej práce: Návrh na názov bakalárkej práce: