diff --git a/pages/students/2019/filip_tomas/README.md b/pages/students/2019/filip_tomas/README.md index 82f964ec..54cb9483 100644 --- a/pages/students/2019/filip_tomas/README.md +++ b/pages/students/2019/filip_tomas/README.md @@ -2,7 +2,7 @@ title: Filip Tomáš published: true taxonomy: - category: [bp2022,dp2024] + category: [bp2022,dp2024,dp2025] tag: [testovanie,javascript,typescript] author: Daniel Hladek --- diff --git a/pages/students/2019/patrik_pokrivcak/README.md b/pages/students/2019/patrik_pokrivcak/README.md index 8f7cd3f4..29aa718c 100644 --- a/pages/students/2019/patrik_pokrivcak/README.md +++ b/pages/students/2019/patrik_pokrivcak/README.md @@ -16,6 +16,13 @@ Téma: Rozpoznávanie nenávistnej reči pomocou veľkých jazykových modelov +Zadanie: + +1. Vypracujte prehľad veľkých jazykových modelov s podporou slovenčiny. +2. Vypracujte prehľad metód rozpoznávania nenávistnej reči pomocou veľkých jazykových modelov. +3. Vyberte vhodnú dátovú množinu pre rozpoznávanie nenávistnej reči a pomocou nej vhodnou metrikou porovnajte viacero jazykových modelov pre úlohu rozpoznávania nenávistnej reči. +4. Vyhodnoťte experimenty a navrhnite zlepšenia rozpoznávania. + Cieľe: - Naučiť sa rozpoznávať nenávistnú reči HS pomocou LLM - lokálnych alebo komerčných. diff --git a/pages/students/2020/david_kostilnik/README.md b/pages/students/2020/david_kostilnik/README.md index 242cdc5e..b0a03606 100644 --- a/pages/students/2020/david_kostilnik/README.md +++ b/pages/students/2020/david_kostilnik/README.md @@ -11,8 +11,6 @@ rok začiatku štúdia: 2020 # Diplomová práca 2025 -Ešte sa rozhodne. - Téma: Sémantické vyhľadávanie pomocou veľkých modelov @@ -24,6 +22,13 @@ Ciele: - Zlepšiť RAG. +Zadanie: + +1. Vypracujte prehľad metód a modelov sémantického vyhľadávania pomocou neurónových sietí. +2. Vyberte vhodnú dátovú množinu a dotrénujte jazykový model pre úlohu sémantického vyhľadávania v slovenčine. +3. Navrhnite a vykonajte experimenty pre vyhodnotenie dotrénovaného modelu. +4. Vyhodnotťte experimenty a navrhnite zlepšenia. + Stretnutie 29.10.2024 diff --git a/pages/students/2020/kamil_tomcufcik/README.md b/pages/students/2020/kamil_tomcufcik/README.md index 74fe407e..a9b9c624 100644 --- a/pages/students/2020/kamil_tomcufcik/README.md +++ b/pages/students/2020/kamil_tomcufcik/README.md @@ -15,6 +15,13 @@ Ciel: Overiť a zlepšiť možnosti generovania jednotkových testov +Zadanie: + +1. Vypracujte prehľad veľkých jazykových modelov s podporou generovania programového kódu. +2. Vyberte vhodnú dátovú množinu a metriku na vyhodnotenie generovania kódu. +3. Navrhnite a vyhodnoťte experimenty s generovaním kódu s pomocou veľkého jazykového modelu. +4. Identifikujte slabé miesta a navrhnite zlepšenia. + Stretnutie 12.12.2024 Stav: diff --git a/pages/students/2020/pavol_hudak/README.md b/pages/students/2020/pavol_hudak/README.md index 880703c2..d377b6d7 100644 --- a/pages/students/2020/pavol_hudak/README.md +++ b/pages/students/2020/pavol_hudak/README.md @@ -3,7 +3,7 @@ title: Pavol Hudák published: true taxonomy: category: [dp2025] - tag: [ir] + tag: [nlp,qa] author: Daniel Hladek --- @@ -11,6 +11,17 @@ rok začiatku štúdia: 2020 # Diplomová práca 2025 +Dotrénovanie veľkého jazykového modelu na odpovede v slovenčine + +Zadanie: + +1. Vypracujte prehľad veľkých jazykových modelov v slovenčine. +2. Vypracujte prehľad metód dotrénovania veľkých jazykových modelov. +3. Vyberte vhodnú dátovú množinu v slovenčine a dotrénujte veľký jazykový model. +4. Vyhodnoťte experimenty a navrhnite zlepšenia. + + + Ciel: - Dotrénovanie LLM pre zlepšenie jeho schopnosti odpovedať na otázku v slovenskom jazyku. diff --git a/pages/students/2021/artur_hyrenko/README.md b/pages/students/2021/artur_hyrenko/README.md index 7e2d4168..3270f526 100644 --- a/pages/students/2021/artur_hyrenko/README.md +++ b/pages/students/2021/artur_hyrenko/README.md @@ -14,5 +14,20 @@ rok začiatku štúdia: 2021 Vyhondotenie jayzkových modelov +Stretnutie 5.2.2025 + +Úlohy: + +- Oboznámte sa s problematikou veľkých jazykových modelov. Towards Data Science +- Naučte sa Python lepšie +- Poučte sa o strojovom účení. +- Vyskúšajte si framework HF Transformers +- Vyskúšajte si veľký jazykový model, napr. cez systém OLLAMA. +- Oboznámte sa s frameworkom lm-eval-harness. Zistite, aké úlohy a aké metriky sa používajú. + +Zásobník úloh: + +- Nájdite na webe zaujímavý zdroj otázok a odpovedí, ktorý by bol vhodný na vyhodnotneie jazykového modelu. +- Vyberte úlohu vhodú na anotáciu (spolu s vedúcim).