From 63d49d112412e735ad0318c0ec74464c8e773f06 Mon Sep 17 00:00:00 2001 From: dano Date: Fri, 5 Dec 2025 10:15:21 +0000 Subject: [PATCH] Update pages/students/2023/denis_le_thanh/README.md --- pages/students/2023/denis_le_thanh/README.md | 13 +++++++++++++ 1 file changed, 13 insertions(+) diff --git a/pages/students/2023/denis_le_thanh/README.md b/pages/students/2023/denis_le_thanh/README.md index 224e8555c..6b6a3ab2e 100644 --- a/pages/students/2023/denis_le_thanh/README.md +++ b/pages/students/2023/denis_le_thanh/README.md @@ -28,6 +28,19 @@ Ciele: - Skúsiť dotrénovať slovenský generatívny model (slovak-mistral-7b) pre inštrukcie. +Stretnutie 5.12. (K. Sopkovič) + +Stav: + +- Analyticka praca cca 12 stran +- Su potrebne vyhotiv zmeny - tema musi suvisiet so studijnum odborom - kyberbezpecnost (potrebna diskusia s D.Hladek). - Navrhujeme kontrolu obsahu instrukcii? Filter? Hate Speech model do pipeline? k dispozicii je fine tunning script ktory treba este doladit + +Úlohy: + +- Skuste upravit poskytnuty script p.doc. Hladekom aby spojazdnil dotrenovanie pomocou QLORA na datasete https://huggingface.co/datasets/saillab/alpaca-slovak-cleaned/ +- Pre hlbsie experimenty bude treba vubavit pristup na server (zatial je vysoko doporucena free verzia na google collab) - odporucam video z youtube ako tutorial pre pracu v collabe - popripadne kontaktovat veduceho prace Ing. Kormanika pre vybavenie pristupu na DGX / podobny server vzhaldom na vypoctovu narocnost (tutorial ako pouzivat server bude poskytnuty konzultantom Sopkovicom) +- Urobit prieskum moznych verejnych datesetov podobnym alpace, ktore by sa mohli pouzit + Stretnutie 3.10.2025 Stav: