zpwiki/pages/students/2020/kamil_tomcufcik/README.md

---
title: Kamil Tomčufčík
published: true
taxonomy:
    category: [dp2025]
    tag: [lm]
    author: Daniel Hladek
---

rok začiatku štúdia: 2020

# Diplomová práca 2025

Ciel:

Overiť a zlepšiť možnosti generovania jednotkových testov

Stretnutie 12.12.2024

Stav:

- Metrika Pass@K sa používa na vyhodnotenie generovaného kódu. Meria, koľko automatických textov bolo splnených. Používa sa aj BLEU, verzia CodeBLEU. CodeJudge.
- Na testovanie generovaných testov sa používajú: vykonanie produkčného kódu, pokrytie testov, mutácie kódu, statická analýza generovaného kódu.

Stretnutie 14.11. 2924

Stav:

- Vyhľadané modely na generovanie kódu. Nie sú vyskúšané. Codex, CodeParrot a Incoder. Na unittesty CodeT5 a AthenaTest.
- Rozčítané knihy podľa pokynov.

Úlohy:

Zistite odpovede na tieto otázky:
- Ako zistíme, že vygenerovaný kód je dobrý.
- Ako zistíme, že vygenerovaný test vyhovuje špecifikácii?
- Vypracujte písomný prehľad. Napíšte aké modely sa používajú, Akým spôsobom sa vyhodnocujú. Použite odborné článkyl. Odborné články nájdete na google scholar alebo scopus.
- Pripravte vzorovú dátovú množinu. Hotové testy, implementácie aj dokumentáciu., Možno vybrať exsitujúci open source projekt alebo hotovú dátovú množinu. 
- Vyskúšajte niekoľko jazkovych modelov pre generovanie kódu aj generovanie testov. 
- Do diplomovej práce vypracujte experimenty kde vyhodnotíte jazykové modely pre generovanie testov v rôznych prostrediach. 

Zásobník úloh:

- Dotrénujte model pre lepšie generovansie testov. 


Stretnutie online 5.2.2024:

Úlohy:

- Nainštalujte si prostredie Anaconda, pozrite si knihu https://diveintopython3.net/ 
Dive Into Python 3
- pre úvod do neurónových sietí si prečítajte knihu https://d2l.ai/index.html Dive into Deep Learning — Dive into Deep Learning 1.0.3 documentation
- vyskúšajte viac modelov pre generovanie kódu. Codex, Copilot, ChatGPT
- zistite ako funguje veľký jazykový model


Zásobník úloh (zadanie na ďalšie stretnutie):

- Zistite zoznam open source modelov pre generovanie kódu a porovnajte ich možnosti. Zoznam zapíšte do textového súboru.
- Vyberte si jeden z modelov na generovanie kódu, nainštalujte si ho a vyskúšajte.
- Zistite, ako sa číselne vyjadrí kvalita generovania počítačového kódu. Aké metriky sa používajú? Zistie aké trénovacie a vyhodnocovacie množiny sa používaju. Zoznam zapíšte do súboru.
- Zistite, ako sa dá taký model "dotrénovať" na špecifickú úlohu generovania testov.
zz 2024-02-16 13:32:20 +00:00			`---`
			`title: Kamil Tomčufčík`
			`published: true`
			`taxonomy:`
			`category: [dp2025]`
			`tag: [lm]`
			`author: Daniel Hladek`
			`---`

			`rok začiatku štúdia: 2020`

			`# Diplomová práca 2025`

			`Ciel:`

			`Overiť a zlepšiť možnosti generovania jednotkových testov`

Update pages/students/2020/kamil_tomcufcik/README.md 2024-12-12 09:53:08 +00:00			`Stretnutie 12.12.2024`

			`Stav:`

Update pages/students/2020/kamil_tomcufcik/README.md 2024-12-12 09:59:41 +00:00			`- Metrika Pass@K sa používa na vyhodnotenie generovaného kódu. Meria, koľko automatických textov bolo splnených. Používa sa aj BLEU, verzia CodeBLEU. CodeJudge.`
			`- Na testovanie generovaných testov sa používajú: vykonanie produkčného kódu, pokrytie testov, mutácie kódu, statická analýza generovaného kódu.`
Update pages/students/2020/kamil_tomcufcik/README.md 2024-12-12 09:53:08 +00:00
Update pages/students/2020/kamil_tomcufcik/README.md 2024-11-14 09:03:47 +00:00			`Stretnutie 14.11. 2924`
zz 2024-02-16 13:32:20 +00:00
Update pages/students/2020/kamil_tomcufcik/README.md 2024-11-14 09:03:47 +00:00			`Stav:`

			`- Vyhľadané modely na generovanie kódu. Nie sú vyskúšané. Codex, CodeParrot a Incoder. Na unittesty CodeT5 a AthenaTest.`
			`- Rozčítané knihy podľa pokynov.`

			`Úlohy:`

			`Zistite odpovede na tieto otázky:`
			`- Ako zistíme, že vygenerovaný kód je dobrý.`
			`- Ako zistíme, že vygenerovaný test vyhovuje špecifikácii?`
Update pages/students/2020/kamil_tomcufcik/README.md 2024-12-12 09:53:08 +00:00			`- Vypracujte písomný prehľad. Napíšte aké modely sa používajú, Akým spôsobom sa vyhodnocujú. Použite odborné článkyl. Odborné články nájdete na google scholar alebo scopus.`
Update pages/students/2020/kamil_tomcufcik/README.md 2024-11-14 09:03:47 +00:00			`- Pripravte vzorovú dátovú množinu. Hotové testy, implementácie aj dokumentáciu., Možno vybrať exsitujúci open source projekt alebo hotovú dátovú množinu.`
			`- Vyskúšajte niekoľko jazkovych modelov pre generovanie kódu aj generovanie testov.`
			`- Do diplomovej práce vypracujte experimenty kde vyhodnotíte jazykové modely pre generovanie testov v rôznych prostrediach.`

			`Zásobník úloh:`

			`- Dotrénujte model pre lepšie generovansie testov.`



			`Stretnutie online 5.2.2024:`
zz 2024-02-16 13:32:20 +00:00
			`Úlohy:`

			`- Nainštalujte si prostredie Anaconda, pozrite si knihu https://diveintopython3.net/`
			`Dive Into Python 3`
			`- pre úvod do neurónových sietí si prečítajte knihu https://d2l.ai/index.html Dive into Deep Learning — Dive into Deep Learning 1.0.3 documentation`
			`- vyskúšajte viac modelov pre generovanie kódu. Codex, Copilot, ChatGPT`
			`- zistite ako funguje veľký jazykový model`


			`Zásobník úloh (zadanie na ďalšie stretnutie):`

			`- Zistite zoznam open source modelov pre generovanie kódu a porovnajte ich možnosti. Zoznam zapíšte do textového súboru.`
			`- Vyberte si jeden z modelov na generovanie kódu, nainštalujte si ho a vyskúšajte.`
			`- Zistite, ako sa číselne vyjadrí kvalita generovania počítačového kódu. Aké metriky sa používajú? Zistie aké trénovacie a vyhodnocovacie množiny sa používaju. Zoznam zapíšte do súboru.`
			`- Zistite, ako sa dá taký model "dotrénovať" na špecifickú úlohu generovania testov.`