diff --git a/pages/students/2023/denis_le_thanh/README.md b/pages/students/2023/denis_le_thanh/README.md index 224e8555c..6b6a3ab2e 100644 --- a/pages/students/2023/denis_le_thanh/README.md +++ b/pages/students/2023/denis_le_thanh/README.md @@ -28,6 +28,19 @@ Ciele: - Skúsiť dotrénovať slovenský generatívny model (slovak-mistral-7b) pre inštrukcie. +Stretnutie 5.12. (K. Sopkovič) + +Stav: + +- Analyticka praca cca 12 stran +- Su potrebne vyhotiv zmeny - tema musi suvisiet so studijnum odborom - kyberbezpecnost (potrebna diskusia s D.Hladek). - Navrhujeme kontrolu obsahu instrukcii? Filter? Hate Speech model do pipeline? k dispozicii je fine tunning script ktory treba este doladit + +Úlohy: + +- Skuste upravit poskytnuty script p.doc. Hladekom aby spojazdnil dotrenovanie pomocou QLORA na datasete https://huggingface.co/datasets/saillab/alpaca-slovak-cleaned/ +- Pre hlbsie experimenty bude treba vubavit pristup na server (zatial je vysoko doporucena free verzia na google collab) - odporucam video z youtube ako tutorial pre pracu v collabe - popripadne kontaktovat veduceho prace Ing. Kormanika pre vybavenie pristupu na DGX / podobny server vzhaldom na vypoctovu narocnost (tutorial ako pouzivat server bude poskytnuty konzultantom Sopkovicom) +- Urobit prieskum moznych verejnych datesetov podobnym alpace, ktore by sa mohli pouzit + Stretnutie 3.10.2025 Stav: