dmytro_ushatenko/pages/students/2020/pavol_hudak/README.md
2024-02-14 12:00:10 +01:00

897 B

title published taxonomy
Pavol Hudák true
category tag author
dp2025
ir
Daniel Hladek

rok začiatku štúdia: 2020

Diplomová práca 2025

Ciel:

Vylepšiť slovenský veľký jazykový model.

Vybrať jednu z úloh:

  • Tvorba instruct datasetu - Anotácia alebo preklad množín
  • Dotrénvanie LLM na dostupnom hardvéri - LORA-PEFT
  • Rozpoznávanie nenávistnej reči (pomocou LLM?, prompting, finetuning)

Stretnutie 14.2.

Úlohy:

  • Oboznámiť sa s veľkými jazykovými modelmi LLM. Ako funguje ChatGPT? Čo je to LLAMA? Napíšte si poznámky.
  • Nainštalujte si Anaconda.
  • Pokračujte v štúdiu Python. Preštudujte si knihu Dive deep into deep learning.
  • Nainštalujte si knižnicu Huggingface Transformers. Vyskúšajte LLM model LLAMA https://huggingface.co/meta-llama/Llama-2-70b
  • Prejdite si tento tutoriál https://huggingface.co/blog/llama2