--- title: Pavol Hudák published: true taxonomy: category: [dp2025] tag: [ir] author: Daniel Hladek --- rok začiatku štúdia: 2020 # Diplomová práca 2025 Ciel: Vylepšiť slovenský veľký jazykový model. Vybrať jednu z úloh: - Tvorba instruct datasetu - Anotácia alebo preklad množín - Dotrénvanie LLM na dostupnom hardvéri - LORA-PEFT - Rozpoznávanie nenávistnej reči (pomocou LLM?, prompting, finetuning) Stretnutie 14.2. Úlohy: - Oboznámiť sa s veľkými jazykovými modelmi LLM. Ako funguje ChatGPT? Čo je to LLAMA? Napíšte si poznámky. - Nainštalujte si Anaconda. - Pokračujte v štúdiu Python. Preštudujte si knihu Dive deep into deep learning. - Nainštalujte si knižnicu Huggingface Transformers. Vyskúšajte LLM model LLAMA https://huggingface.co/meta-llama/Llama-2-70b - Prejdite si tento tutoriál https://huggingface.co/blog/llama2