Merge branch 'master' of git.kemt.fei.tuke.sk:KEMT/zpwiki

This commit is contained in:
Daniel Hládek 2025-02-10 08:31:21 +01:00
commit 1162e335f9
6 changed files with 49 additions and 4 deletions

View File

@ -2,7 +2,7 @@
title: Filip Tomáš title: Filip Tomáš
published: true published: true
taxonomy: taxonomy:
category: [bp2022,dp2024] category: [bp2022,dp2024,dp2025]
tag: [testovanie,javascript,typescript] tag: [testovanie,javascript,typescript]
author: Daniel Hladek author: Daniel Hladek
--- ---

View File

@ -16,6 +16,13 @@ Téma:
Rozpoznávanie nenávistnej reči pomocou veľkých jazykových modelov Rozpoznávanie nenávistnej reči pomocou veľkých jazykových modelov
Zadanie:
1. Vypracujte prehľad veľkých jazykových modelov s podporou slovenčiny.
2. Vypracujte prehľad metód rozpoznávania nenávistnej reči pomocou veľkých jazykových modelov.
3. Vyberte vhodnú dátovú množinu pre rozpoznávanie nenávistnej reči a pomocou nej vhodnou metrikou porovnajte viacero jazykových modelov pre úlohu rozpoznávania nenávistnej reči.
4. Vyhodnoťte experimenty a navrhnite zlepšenia rozpoznávania.
Cieľe: Cieľe:
- Naučiť sa rozpoznávať nenávistnú reči HS pomocou LLM - lokálnych alebo komerčných. - Naučiť sa rozpoznávať nenávistnú reči HS pomocou LLM - lokálnych alebo komerčných.

View File

@ -11,8 +11,6 @@ rok začiatku štúdia: 2020
# Diplomová práca 2025 # Diplomová práca 2025
Ešte sa rozhodne.
Téma: Téma:
Sémantické vyhľadávanie pomocou veľkých modelov Sémantické vyhľadávanie pomocou veľkých modelov
@ -24,6 +22,13 @@ Ciele:
- Zlepšiť RAG. - Zlepšiť RAG.
Zadanie:
1. Vypracujte prehľad metód a modelov sémantického vyhľadávania pomocou neurónových sietí.
2. Vyberte vhodnú dátovú množinu a dotrénujte jazykový model pre úlohu sémantického vyhľadávania v slovenčine.
3. Navrhnite a vykonajte experimenty pre vyhodnotenie dotrénovaného modelu.
4. Vyhodnotťte experimenty a navrhnite zlepšenia.
Stretnutie 29.10.2024 Stretnutie 29.10.2024

View File

@ -15,6 +15,13 @@ Ciel:
Overiť a zlepšiť možnosti generovania jednotkových testov Overiť a zlepšiť možnosti generovania jednotkových testov
Zadanie:
1. Vypracujte prehľad veľkých jazykových modelov s podporou generovania programového kódu.
2. Vyberte vhodnú dátovú množinu a metriku na vyhodnotenie generovania kódu.
3. Navrhnite a vyhodnoťte experimenty s generovaním kódu s pomocou veľkého jazykového modelu.
4. Identifikujte slabé miesta a navrhnite zlepšenia.
Stretnutie 12.12.2024 Stretnutie 12.12.2024
Stav: Stav:

View File

@ -3,7 +3,7 @@ title: Pavol Hudák
published: true published: true
taxonomy: taxonomy:
category: [dp2025] category: [dp2025]
tag: [ir] tag: [nlp,qa]
author: Daniel Hladek author: Daniel Hladek
--- ---
@ -11,6 +11,17 @@ rok začiatku štúdia: 2020
# Diplomová práca 2025 # Diplomová práca 2025
Dotrénovanie veľkého jazykového modelu na odpovede v slovenčine
Zadanie:
1. Vypracujte prehľad veľkých jazykových modelov v slovenčine.
2. Vypracujte prehľad metód dotrénovania veľkých jazykových modelov.
3. Vyberte vhodnú dátovú množinu v slovenčine a dotrénujte veľký jazykový model.
4. Vyhodnoťte experimenty a navrhnite zlepšenia.
Ciel: Ciel:
- Dotrénovanie LLM pre zlepšenie jeho schopnosti odpovedať na otázku v slovenskom jazyku. - Dotrénovanie LLM pre zlepšenie jeho schopnosti odpovedať na otázku v slovenskom jazyku.

View File

@ -14,5 +14,20 @@ rok začiatku štúdia: 2021
Vyhondotenie jayzkových modelov Vyhondotenie jayzkových modelov
Stretnutie 5.2.2025
Úlohy:
- Oboznámte sa s problematikou veľkých jazykových modelov. Towards Data Science
- Naučte sa Python lepšie
- Poučte sa o strojovom účení.
- Vyskúšajte si framework HF Transformers
- Vyskúšajte si veľký jazykový model, napr. cez systém OLLAMA.
- Oboznámte sa s frameworkom lm-eval-harness. Zistite, aké úlohy a aké metriky sa používajú.
Zásobník úloh:
- Nájdite na webe zaujímavý zdroj otázok a odpovedí, ktorý by bol vhodný na vyhodnotneie jazykového modelu.
- Vyberte úlohu vhodú na anotáciu (spolu s vedúcim).