Compare commits

..

No commits in common. "870a4944345473ca02e0e1d1b7640a5a06092598" and "01bbdbd87174d508f3238d2e64fe4f70fbe9ae8c" have entirely different histories.

View File

@ -2,36 +2,13 @@
title: Kristián Sopkovič title: Kristián Sopkovič
published: true published: true
taxonomy: taxonomy:
category: [bp2022,dp2024] category: [bp2022]
tag: [spacy,nlp] tag: [spacy,nlp]
author: Daniel Hladek author: Daniel Hladek
--- ---
rok začiatku štúdia: 2019 rok začiatku štúdia: 2019
# Diplomová práca 2024
Súvisiace práce: Michal Stromko
Cieľ je zlepšiť slovenské vyhľadávanie pomocou neurónových sietí.
Námety na tému:
- Natrénujte alebo dotrénujte Sentence Transformer Model, alebo iný model pre sémantícké vyhľadávanie. Aké sú potrebné databázy? Je možné dotrénovať multilinguálny model?
- Vytvorte databázu pre trénovanie SBERT. Strojový preklad, existujúcej NLI databázy, Semantic Textual Similarity databázy. Alebo ak získame grant, tak vytvoríme "originálnu" (klon) slovenskú databázu.
Stretnutie 24.11.
Úlohy:
- Porozmýľať ďalej o téme, komuikovať o možnom grante na anotáciu.
- Vyskúšajte [Sentence Transformers framework](https://github.com/UKPLab/sentence-transformers/tree/master/examples). Pozrite si príklady, ako trénovať.
- Prečítajte si článok https://arxiv.org/abs/1908.10084.
- Zistite, čo je Natural Language Inference, aké sú dostupné databázy.
- Zistite, čo je Semantic Textual Similarity, aké sú dostupné databázy.
- Pozrite si https://git.kemt.fei.tuke.sk/dano/slovakretrieval/
# Bakalárska práca 2022 # Bakalárska práca 2022
Návrh na názov bakalárkej práce: Návrh na názov bakalárkej práce: