diff --git a/pages/topics/otvorene/README.md b/pages/topics/otvorene/README.md index 74dc6959c6..5043a82204 100644 --- a/pages/topics/otvorene/README.md +++ b/pages/topics/otvorene/README.md @@ -15,7 +15,7 @@ Daniel Hládek - Čistenie dát - zlepšenie webových trénovacích korpusov. Identifikácia "neužitočných častí" textu. - Sumarizácia na súdnych alebo lekárskych dátach. -- Dotrénovanie jazykového modelu pre súdnu alebo lekársky doménu. +- Dotrénovanie jazykového modelu pre súdnu alebo lekársku doménu. LORA/PEFT. - Spracovanie pomenovaných entít - anonymizácia. - Opis obrázku v slovenskom jazyku. Zatiaľ neviem ako. - Grafové neurónové siete - súdna doména. Alebo Open Data. @@ -28,6 +28,8 @@ Daniel Hládek - LLM Agents - function calling, REACT. - reinformcement v LLM - https://huggingface.co/docs/trl/index - Vytvorenie anotovaných dát v slovenčine. Akých? Reasoning? Grammar? Parallel? +- Model distilation. +- Skript pre generovanie "gramatických chýb". ## Bakalárske práce