forked from KEMT/zpwiki
Update pages/students/2023/denis_le_thanh/README.md
This commit is contained in:
parent
0c78264b7d
commit
63d49d1124
@ -28,6 +28,19 @@ Ciele:
|
||||
|
||||
- Skúsiť dotrénovať slovenský generatívny model (slovak-mistral-7b) pre inštrukcie.
|
||||
|
||||
Stretnutie 5.12. (K. Sopkovič)
|
||||
|
||||
Stav:
|
||||
|
||||
- Analyticka praca cca 12 stran
|
||||
- Su potrebne vyhotiv zmeny - tema musi suvisiet so studijnum odborom - kyberbezpecnost (potrebna diskusia s D.Hladek). - Navrhujeme kontrolu obsahu instrukcii? Filter? Hate Speech model do pipeline? k dispozicii je fine tunning script ktory treba este doladit
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Skuste upravit poskytnuty script p.doc. Hladekom aby spojazdnil dotrenovanie pomocou QLORA na datasete https://huggingface.co/datasets/saillab/alpaca-slovak-cleaned/
|
||||
- Pre hlbsie experimenty bude treba vubavit pristup na server (zatial je vysoko doporucena free verzia na google collab) - odporucam video z youtube ako tutorial pre pracu v collabe - popripadne kontaktovat veduceho prace Ing. Kormanika pre vybavenie pristupu na DGX / podobny server vzhaldom na vypoctovu narocnost (tutorial ako pouzivat server bude poskytnuty konzultantom Sopkovicom)
|
||||
- Urobit prieskum moznych verejnych datesetov podobnym alpace, ktore by sa mohli pouzit
|
||||
|
||||
Stretnutie 3.10.2025
|
||||
|
||||
Stav:
|
||||
|
||||
Loading…
Reference in New Issue
Block a user