From 75d0bbab7f29e57dbc32265390631b1aad2a9ab0 Mon Sep 17 00:00:00 2001 From: dano Date: Wed, 5 Feb 2025 14:45:11 +0000 Subject: [PATCH 1/6] Update pages/students/2021/artur_hyrenko/README.md --- pages/students/2021/artur_hyrenko/README.md | 15 +++++++++++++++ 1 file changed, 15 insertions(+) diff --git a/pages/students/2021/artur_hyrenko/README.md b/pages/students/2021/artur_hyrenko/README.md index 7e2d4168..3270f526 100644 --- a/pages/students/2021/artur_hyrenko/README.md +++ b/pages/students/2021/artur_hyrenko/README.md @@ -14,5 +14,20 @@ rok začiatku štúdia: 2021 Vyhondotenie jayzkových modelov +Stretnutie 5.2.2025 + +Úlohy: + +- Oboznámte sa s problematikou veľkých jazykových modelov. Towards Data Science +- Naučte sa Python lepšie +- Poučte sa o strojovom účení. +- Vyskúšajte si framework HF Transformers +- Vyskúšajte si veľký jazykový model, napr. cez systém OLLAMA. +- Oboznámte sa s frameworkom lm-eval-harness. Zistite, aké úlohy a aké metriky sa používajú. + +Zásobník úloh: + +- Nájdite na webe zaujímavý zdroj otázok a odpovedí, ktorý by bol vhodný na vyhodnotneie jazykového modelu. +- Vyberte úlohu vhodú na anotáciu (spolu s vedúcim). From fe04ed6240bc456552d1a2f1cd8961dc83029458 Mon Sep 17 00:00:00 2001 From: dano Date: Fri, 7 Feb 2025 08:26:58 +0000 Subject: [PATCH 2/6] Update pages/students/2019/filip_tomas/README.md --- pages/students/2019/filip_tomas/README.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/pages/students/2019/filip_tomas/README.md b/pages/students/2019/filip_tomas/README.md index 82f964ec..54cb9483 100644 --- a/pages/students/2019/filip_tomas/README.md +++ b/pages/students/2019/filip_tomas/README.md @@ -2,7 +2,7 @@ title: Filip Tomáš published: true taxonomy: - category: [bp2022,dp2024] + category: [bp2022,dp2024,dp2025] tag: [testovanie,javascript,typescript] author: Daniel Hladek --- From bd98a9d3beaa5c331fa90efc4fe62931eaba80e1 Mon Sep 17 00:00:00 2001 From: dano Date: Fri, 7 Feb 2025 08:33:48 +0000 Subject: [PATCH 3/6] Update pages/students/2019/patrik_pokrivcak/README.md --- pages/students/2019/patrik_pokrivcak/README.md | 7 +++++++ 1 file changed, 7 insertions(+) diff --git a/pages/students/2019/patrik_pokrivcak/README.md b/pages/students/2019/patrik_pokrivcak/README.md index 8f7cd3f4..29aa718c 100644 --- a/pages/students/2019/patrik_pokrivcak/README.md +++ b/pages/students/2019/patrik_pokrivcak/README.md @@ -16,6 +16,13 @@ Téma: Rozpoznávanie nenávistnej reči pomocou veľkých jazykových modelov +Zadanie: + +1. Vypracujte prehľad veľkých jazykových modelov s podporou slovenčiny. +2. Vypracujte prehľad metód rozpoznávania nenávistnej reči pomocou veľkých jazykových modelov. +3. Vyberte vhodnú dátovú množinu pre rozpoznávanie nenávistnej reči a pomocou nej vhodnou metrikou porovnajte viacero jazykových modelov pre úlohu rozpoznávania nenávistnej reči. +4. Vyhodnoťte experimenty a navrhnite zlepšenia rozpoznávania. + Cieľe: - Naučiť sa rozpoznávať nenávistnú reči HS pomocou LLM - lokálnych alebo komerčných. From 01da2a3768b70aeb337604cfd2a4cbe104005aee Mon Sep 17 00:00:00 2001 From: dano Date: Fri, 7 Feb 2025 08:41:42 +0000 Subject: [PATCH 4/6] Update pages/students/2020/pavol_hudak/README.md --- pages/students/2020/pavol_hudak/README.md | 13 ++++++++++++- 1 file changed, 12 insertions(+), 1 deletion(-) diff --git a/pages/students/2020/pavol_hudak/README.md b/pages/students/2020/pavol_hudak/README.md index 880703c2..d377b6d7 100644 --- a/pages/students/2020/pavol_hudak/README.md +++ b/pages/students/2020/pavol_hudak/README.md @@ -3,7 +3,7 @@ title: Pavol Hudák published: true taxonomy: category: [dp2025] - tag: [ir] + tag: [nlp,qa] author: Daniel Hladek --- @@ -11,6 +11,17 @@ rok začiatku štúdia: 2020 # Diplomová práca 2025 +Dotrénovanie veľkého jazykového modelu na odpovede v slovenčine + +Zadanie: + +1. Vypracujte prehľad veľkých jazykových modelov v slovenčine. +2. Vypracujte prehľad metód dotrénovania veľkých jazykových modelov. +3. Vyberte vhodnú dátovú množinu v slovenčine a dotrénujte veľký jazykový model. +4. Vyhodnoťte experimenty a navrhnite zlepšenia. + + + Ciel: - Dotrénovanie LLM pre zlepšenie jeho schopnosti odpovedať na otázku v slovenskom jazyku. From 063dcd1efa0892d64f8f20ea9a96f2924974afa9 Mon Sep 17 00:00:00 2001 From: dano Date: Fri, 7 Feb 2025 09:06:22 +0000 Subject: [PATCH 5/6] Update pages/students/2020/kamil_tomcufcik/README.md --- pages/students/2020/kamil_tomcufcik/README.md | 7 +++++++ 1 file changed, 7 insertions(+) diff --git a/pages/students/2020/kamil_tomcufcik/README.md b/pages/students/2020/kamil_tomcufcik/README.md index 74fe407e..a9b9c624 100644 --- a/pages/students/2020/kamil_tomcufcik/README.md +++ b/pages/students/2020/kamil_tomcufcik/README.md @@ -15,6 +15,13 @@ Ciel: Overiť a zlepšiť možnosti generovania jednotkových testov +Zadanie: + +1. Vypracujte prehľad veľkých jazykových modelov s podporou generovania programového kódu. +2. Vyberte vhodnú dátovú množinu a metriku na vyhodnotenie generovania kódu. +3. Navrhnite a vyhodnoťte experimenty s generovaním kódu s pomocou veľkého jazykového modelu. +4. Identifikujte slabé miesta a navrhnite zlepšenia. + Stretnutie 12.12.2024 Stav: From bea2c670ec9987641fa897c5545306638842688e Mon Sep 17 00:00:00 2001 From: dano Date: Fri, 7 Feb 2025 09:17:19 +0000 Subject: [PATCH 6/6] Update pages/students/2020/david_kostilnik/README.md --- pages/students/2020/david_kostilnik/README.md | 9 +++++++-- 1 file changed, 7 insertions(+), 2 deletions(-) diff --git a/pages/students/2020/david_kostilnik/README.md b/pages/students/2020/david_kostilnik/README.md index 242cdc5e..b0a03606 100644 --- a/pages/students/2020/david_kostilnik/README.md +++ b/pages/students/2020/david_kostilnik/README.md @@ -11,8 +11,6 @@ rok začiatku štúdia: 2020 # Diplomová práca 2025 -Ešte sa rozhodne. - Téma: Sémantické vyhľadávanie pomocou veľkých modelov @@ -24,6 +22,13 @@ Ciele: - Zlepšiť RAG. +Zadanie: + +1. Vypracujte prehľad metód a modelov sémantického vyhľadávania pomocou neurónových sietí. +2. Vyberte vhodnú dátovú množinu a dotrénujte jazykový model pre úlohu sémantického vyhľadávania v slovenčine. +3. Navrhnite a vykonajte experimenty pre vyhodnotenie dotrénovaného modelu. +4. Vyhodnotťte experimenty a navrhnite zlepšenia. + Stretnutie 29.10.2024