diff --git a/pages/students/2019/kristian_sopkovic/README.md b/pages/students/2019/kristian_sopkovic/README.md index 9bff7c60d7..a6269aea77 100644 --- a/pages/students/2019/kristian_sopkovic/README.md +++ b/pages/students/2019/kristian_sopkovic/README.md @@ -30,6 +30,7 @@ Námety na tému: - Natrénujte alebo dotrénujte Sentence Transformer Model, alebo iný model pre sémantícké vyhľadávanie. Aké sú potrebné databázy? Je možné dotrénovať multilinguálny model? - Vytvorte databázu pre trénovanie SBERT. Strojový preklad, existujúcej NLI databázy, Semantic Textual Similarity databázy. Alebo ak získame grant, tak vytvoríme "originálnu" (klon) slovenskú databázu. +- Vytvorte kognitívne vyhľadávanie pre mesto Košice [Slovak Semantic Textual Similarity Benchmark](https://huggingface.co/datasets/crabz/stsb-sk) @@ -56,6 +57,13 @@ Nápady: Úlohy: - Porozmýšľať ktorú časť problému "pomoci občanom mesta Košice" by sme mohli riešiť. +- Spracujte dodané dáta od mesta Košice (vedúci pripraví a pošle). +- Dáta zaindexujte a pripravte jednoduché vyhľadávanie. +- Pokračujte v písomnej teoretickej príprave na tému "Sentence Transformers". + +Zásobník úloh: + +- Pripravte scraper na dáta od mesta Košice.