This commit is contained in:
Daniel Hládek 2025-01-21 13:08:59 +01:00
parent 98c2db90c6
commit 93e36fd356

View File

@ -15,7 +15,7 @@ Daniel Hládek
- Čistenie dát - zlepšenie webových trénovacích korpusov. Identifikácia "neužitočných častí" textu. - Čistenie dát - zlepšenie webových trénovacích korpusov. Identifikácia "neužitočných častí" textu.
- Sumarizácia na súdnych alebo lekárskych dátach. - Sumarizácia na súdnych alebo lekárskych dátach.
- Dotrénovanie jazykového modelu pre súdnu alebo lekársky doménu. - Dotrénovanie jazykového modelu pre súdnu alebo lekársku doménu. LORA/PEFT.
- Spracovanie pomenovaných entít - anonymizácia. - Spracovanie pomenovaných entít - anonymizácia.
- Opis obrázku v slovenskom jazyku. Zatiaľ neviem ako. - Opis obrázku v slovenskom jazyku. Zatiaľ neviem ako.
- Grafové neurónové siete - súdna doména. Alebo Open Data. - Grafové neurónové siete - súdna doména. Alebo Open Data.
@ -28,6 +28,8 @@ Daniel Hládek
- LLM Agents - function calling, REACT. - LLM Agents - function calling, REACT.
- reinformcement v LLM - https://huggingface.co/docs/trl/index - reinformcement v LLM - https://huggingface.co/docs/trl/index
- Vytvorenie anotovaných dát v slovenčine. Akých? Reasoning? Grammar? Parallel? - Vytvorenie anotovaných dát v slovenčine. Akých? Reasoning? Grammar? Parallel?
- Model distilation.
- Skript pre generovanie "gramatických chýb".
## Bakalárske práce ## Bakalárske práce