From 5a3033991b1fe13d8fbae8dae785506489d52caf Mon Sep 17 00:00:00 2001 From: dano Date: Fri, 5 Apr 2024 13:52:35 +0000 Subject: [PATCH] Update 'pages/students/2020/pavol_hudak/README.md' --- pages/students/2020/pavol_hudak/README.md | 20 +++++++++++++++++++- 1 file changed, 19 insertions(+), 1 deletion(-) diff --git a/pages/students/2020/pavol_hudak/README.md b/pages/students/2020/pavol_hudak/README.md index 1ff03336..d6491d32 100644 --- a/pages/students/2020/pavol_hudak/README.md +++ b/pages/students/2020/pavol_hudak/README.md @@ -13,7 +13,18 @@ rok začiatku štúdia: 2020 Ciel: -Vylepšiť slovenský veľký jazykový model. Vylepšiť RAG - retrieval augmented generation pre slovenčinu. +- Vylepšiť slovenský veľký jazykový model. Vylepšiť RAG - retrieval augmented generation pre slovenčinu. +- Dotrénovanie LLM pre zlepšenie jeho schopnosti odpovedať na otázku v slovenskom jazyku. + +Ciele na semester: + +- Zobrať veľký jazykový model (základný alebo instruct alebo chat). +- Skúsiť ho dotrénovať metódou PEFT pre úlohu Question Answering na korpuse SK QUAD. +- Vyhodnotiť presnosť QA dotrénovaného modelu. + +Ďalšie nápady: + +- Vybrať jednu z úloh: @@ -21,6 +32,13 @@ Vybrať jednu z úloh: - Dotrénovanie LLM na dostupnom hardvéri - LORA-PEFT - Rozpoznávanie nenávistnej reči (pomocou LLM?, prompting, finetuning) +Stretnutie 5.4. + +Stav: + +- Nainštalované PrivateGPT. +- Nainštalovaná Anaconda a Python, aj štúdium a príprava. + Stretnutie 23.2. Stav: