From 93e36fd3567ab1b691ee231a7aa6caea6c99b931 Mon Sep 17 00:00:00 2001 From: Daniel Hladek Date: Tue, 21 Jan 2025 13:08:59 +0100 Subject: [PATCH] zz --- pages/topics/otvorene/README.md | 4 +++- 1 file changed, 3 insertions(+), 1 deletion(-) diff --git a/pages/topics/otvorene/README.md b/pages/topics/otvorene/README.md index 74dc6959..5043a822 100644 --- a/pages/topics/otvorene/README.md +++ b/pages/topics/otvorene/README.md @@ -15,7 +15,7 @@ Daniel Hládek - Čistenie dát - zlepšenie webových trénovacích korpusov. Identifikácia "neužitočných častí" textu. - Sumarizácia na súdnych alebo lekárskych dátach. -- Dotrénovanie jazykového modelu pre súdnu alebo lekársky doménu. +- Dotrénovanie jazykového modelu pre súdnu alebo lekársku doménu. LORA/PEFT. - Spracovanie pomenovaných entít - anonymizácia. - Opis obrázku v slovenskom jazyku. Zatiaľ neviem ako. - Grafové neurónové siete - súdna doména. Alebo Open Data. @@ -28,6 +28,8 @@ Daniel Hládek - LLM Agents - function calling, REACT. - reinformcement v LLM - https://huggingface.co/docs/trl/index - Vytvorenie anotovaných dát v slovenčine. Akých? Reasoning? Grammar? Parallel? +- Model distilation. +- Skript pre generovanie "gramatických chýb". ## Bakalárske práce