From 051ef6fbf3f5432fbe88a08fce6376535b67886a Mon Sep 17 00:00:00 2001 From: dano Date: Thu, 28 Sep 2023 11:19:57 +0000 Subject: [PATCH] Update 'pages/students/2019/kristian_sopkovic/README.md' --- pages/students/2019/kristian_sopkovic/README.md | 8 ++++++++ 1 file changed, 8 insertions(+) diff --git a/pages/students/2019/kristian_sopkovic/README.md b/pages/students/2019/kristian_sopkovic/README.md index 9bff7c60d7..a6269aea77 100644 --- a/pages/students/2019/kristian_sopkovic/README.md +++ b/pages/students/2019/kristian_sopkovic/README.md @@ -30,6 +30,7 @@ Námety na tému: - Natrénujte alebo dotrénujte Sentence Transformer Model, alebo iný model pre sémantícké vyhľadávanie. Aké sú potrebné databázy? Je možné dotrénovať multilinguálny model? - Vytvorte databázu pre trénovanie SBERT. Strojový preklad, existujúcej NLI databázy, Semantic Textual Similarity databázy. Alebo ak získame grant, tak vytvoríme "originálnu" (klon) slovenskú databázu. +- Vytvorte kognitívne vyhľadávanie pre mesto Košice [Slovak Semantic Textual Similarity Benchmark](https://huggingface.co/datasets/crabz/stsb-sk) @@ -56,6 +57,13 @@ Nápady: Úlohy: - Porozmýšľať ktorú časť problému "pomoci občanom mesta Košice" by sme mohli riešiť. +- Spracujte dodané dáta od mesta Košice (vedúci pripraví a pošle). +- Dáta zaindexujte a pripravte jednoduché vyhľadávanie. +- Pokračujte v písomnej teoretickej príprave na tému "Sentence Transformers". + +Zásobník úloh: + +- Pripravte scraper na dáta od mesta Košice.