diff --git a/pages/students/2020/pavol_hudak/README.md b/pages/students/2020/pavol_hudak/README.md new file mode 100644 index 0000000000..398a7af8f5 --- /dev/null +++ b/pages/students/2020/pavol_hudak/README.md @@ -0,0 +1,32 @@ +--- +title: Pavol Hudák +published: true +taxonomy: + category: [dp2025] + tag: [ir] + author: Daniel Hladek +--- + +rok začiatku štúdia: 2020 + +# Diplomová práca 2025 + +Ciel: + +Vylepšiť slovenský veľký jazykový model. + +Vybrať jednu z úloh: + +- Tvorba instruct datasetu - Anotácia alebo preklad množín +- Dotrénvanie LLM na dostupnom hardvéri - LORA-PEFT +- Rozpoznávanie nenávistnej reči (pomocou LLM?, prompting, finetuning) + +Stretnutie 14.2. + +Úlohy: + +- Oboznámiť sa s veľkými jazykovými modelmi LLM. Ako funguje ChatGPT? Čo je to LLAMA? Napíšte si poznámky. +- Nainštalujte si Anaconda. +- Pokračujte v štúdiu Python. Preštudujte si knihu Dive deep into deep learning. +- Nainštalujte si knižnicu Huggingface Transformers. Vyskúšajte LLM model LLAMA https://huggingface.co/meta-llama/Llama-2-70b +- Prejdite si tento tutoriál https://huggingface.co/blog/llama2