Update pages/students/2023/denis_le_thanh/README.md

This commit is contained in:
dano 2025-12-05 10:15:21 +00:00
parent 0c78264b7d
commit 63d49d1124

View File

@ -28,6 +28,19 @@ Ciele:
- Skúsiť dotrénovať slovenský generatívny model (slovak-mistral-7b) pre inštrukcie. - Skúsiť dotrénovať slovenský generatívny model (slovak-mistral-7b) pre inštrukcie.
Stretnutie 5.12. (K. Sopkovič)
Stav:
- Analyticka praca cca 12 stran
- Su potrebne vyhotiv zmeny - tema musi suvisiet so studijnum odborom - kyberbezpecnost (potrebna diskusia s D.Hladek). - Navrhujeme kontrolu obsahu instrukcii? Filter? Hate Speech model do pipeline? k dispozicii je fine tunning script ktory treba este doladit
Úlohy:
- Skuste upravit poskytnuty script p.doc. Hladekom aby spojazdnil dotrenovanie pomocou QLORA na datasete https://huggingface.co/datasets/saillab/alpaca-slovak-cleaned/
- Pre hlbsie experimenty bude treba vubavit pristup na server (zatial je vysoko doporucena free verzia na google collab) - odporucam video z youtube ako tutorial pre pracu v collabe - popripadne kontaktovat veduceho prace Ing. Kormanika pre vybavenie pristupu na DGX / podobny server vzhaldom na vypoctovu narocnost (tutorial ako pouzivat server bude poskytnuty konzultantom Sopkovicom)
- Urobit prieskum moznych verejnych datesetov podobnym alpace, ktore by sa mohli pouzit
Stretnutie 3.10.2025 Stretnutie 3.10.2025
Stav: Stav: