forked from KEMT/zpwiki
		
	Update pages/students/2021/artur_hyrenko/README.md
This commit is contained in:
		
							parent
							
								
									928f746115
								
							
						
					
					
						commit
						3402ee4778
					
				| @ -12,13 +12,36 @@ rok začiatku štúdia: 2021 | |||||||
| 
 | 
 | ||||||
| # Diplomová práca 2026 | # Diplomová práca 2026 | ||||||
| 
 | 
 | ||||||
| Vyhodndotenie jazykových modelov | Vyhodnotenie jazykových modelov | ||||||
|  | 
 | ||||||
|  | (pre bezpečnostné problémy) | ||||||
|  | 
 | ||||||
|  | Možné ciele: | ||||||
|  | 
 | ||||||
|  | - Zistiť, či sú súčasné jazyové modely bezpečné. Aké problémy obsahujú? Menia bezpečnostné vlastnosti na základe jazyka? | ||||||
|  | - Vyhodnotiť viacero jazykových modelov vo viacerých jazykoch. | ||||||
|  | - Navrhnúť zlepšenia na zvýšenie bezpečnosti. | ||||||
| 
 | 
 | ||||||
| Stretnutie 11.6. : | Stretnutie 11.6. : | ||||||
| 
 | 
 | ||||||
| - Štúdium a vyskúšanie Python, Anaconda Transformers | - Štúdium a vyskúšanie Python, Anaconda Transformers | ||||||
| - Písomné poznámky. | - Písomné poznámky. | ||||||
| - Zistil, že ChatGPT dokáže poradiť s útokom na AP alebo na iný server. Netreba to veľa presviedčať. | - Zistil, že ChatGPT dokáže poradiť s útokom na AP alebo na iný server. Netreba to (model) veľa presviedčať. | ||||||
|  | 
 | ||||||
|  | Úlohy: | ||||||
|  | 
 | ||||||
|  | - Pokračujte v praktickej príprave - Transformers  | ||||||
|  | - Vyskúšajte a naštudujte Huggingface TRL. Ako sa dá v modeloch potlačiť toxické správanie? Zistite čo je to RLHF. | ||||||
|  | - Zistite, ako sa vyhodnocujú všeobecné jazykové modely. | ||||||
|  | - Preštudujte si [prácu](https://dspace.cvut.cz/bitstream/handle/10467/115227/F3-DP-2024-Jirkovsky-Adam-DP-final.pdf?sequence=-1&isAllowed=y) a [článok](https://arxiv.org/abs/2412.01020)/ | ||||||
|  | - Vyhľadajte a preskúmajte existujúce dátové sady nebezpečných promptov. "corpus of dangerous-harmful prompts". | ||||||
|  | - Zistite, ako sa vyhodnocujú modely z hľadiska bezpečnosti. Aké škody môžu spôsobiť jazykové modely? Napíšte poznámnky. | ||||||
|  | 
 | ||||||
|  | Zásobník úloh: | ||||||
|  | 
 | ||||||
|  | - Rozšírte a preložte nebezpečné prompty. Aby sme dostali viacjazyčnú sadu (Slovensko-Anglicko-Ruská-Ukrajinská). | ||||||
|  | - Pomocu tejto sady vyhodnoťte viacero jazykových modelov. | ||||||
|  | - Implementujte vlastnú metódu na zvýšenie bezpečnosti modelu.  | ||||||
| 
 | 
 | ||||||
| 
 | 
 | ||||||
| Stretnutie 4.4.2025 | Stretnutie 4.4.2025 | ||||||
|  | |||||||
		Loading…
	
		Reference in New Issue
	
	Block a user