zz
This commit is contained in:
parent
8429bdb20b
commit
76de9e4c63
@ -9,6 +9,30 @@ taxonomy:
|
|||||||
|
|
||||||
rok začiatku štúdia: 2022
|
rok začiatku štúdia: 2022
|
||||||
|
|
||||||
|
# Diplomová práca 2027
|
||||||
|
|
||||||
|
Nápady na tému:
|
||||||
|
|
||||||
|
- Augmentácia dát - generovanie umelých trénovacích množín.
|
||||||
|
- Vyskúšať nové LLM na generovanie trénovacích dát.
|
||||||
|
- Použiť existujúce dáta - zlepšiť ich pomocou LLM alebo generovať podobné dáta.
|
||||||
|
- Generovať a overovať dáta pre vyhodnotenie modelov.
|
||||||
|
- Vyvmyslieť metódy pre vyhodnotenie "kvality dát" - ich "užitočnosť" pre trénovanie.
|
||||||
|
- Preskúmať metídy "učiteľ - žiak." Ako môže jeden model pomôcť pri trénovaní iného modelu.
|
||||||
|
- Vytvoriť novú doménovo orientovanú QA množinu. Vytvoriť Instruct množinu.
|
||||||
|
- Vytvoriť slovenský doménovo orientovaný model.
|
||||||
|
|
||||||
|
Stretnutie 3.10.
|
||||||
|
|
||||||
|
Úlohy:
|
||||||
|
|
||||||
|
- Oboznámiť sa s novými metódami generovania trénovacích množín. Prečítejte si nové články na google scholar a urobte si poznámky.
|
||||||
|
- Kľúčové slovíčka: data augmentation, distillation, question generation,
|
||||||
|
- Pozrite si https://github.com/nlp-uoregon/Okapi
|
||||||
|
- Vyskúšať nové LLM pre generovanie, napr. pomocou ollama. gpt-oss,
|
||||||
|
- Pozrite si https://huggingface.co/docs/trl/en/index. Oboznámte sa s metódami GPO a SFT. Ako dokáže pomôcť existujúci model pri dotrénovaní nového modelu.
|
||||||
|
|
||||||
|
|
||||||
# Bakalárska práca 2025
|
# Bakalárska práca 2025
|
||||||
|
|
||||||
Automatické generovanie otázok zo zadaného textu
|
Automatické generovanie otázok zo zadaného textu
|
||||||
|
Loading…
Reference in New Issue
Block a user