33 lines
897 B
Markdown
33 lines
897 B
Markdown
|
---
|
||
|
title: Pavol Hudák
|
||
|
published: true
|
||
|
taxonomy:
|
||
|
category: [dp2025]
|
||
|
tag: [ir]
|
||
|
author: Daniel Hladek
|
||
|
---
|
||
|
|
||
|
rok začiatku štúdia: 2020
|
||
|
|
||
|
# Diplomová práca 2025
|
||
|
|
||
|
Ciel:
|
||
|
|
||
|
Vylepšiť slovenský veľký jazykový model.
|
||
|
|
||
|
Vybrať jednu z úloh:
|
||
|
|
||
|
- Tvorba instruct datasetu - Anotácia alebo preklad množín
|
||
|
- Dotrénvanie LLM na dostupnom hardvéri - LORA-PEFT
|
||
|
- Rozpoznávanie nenávistnej reči (pomocou LLM?, prompting, finetuning)
|
||
|
|
||
|
Stretnutie 14.2.
|
||
|
|
||
|
Úlohy:
|
||
|
|
||
|
- Oboznámiť sa s veľkými jazykovými modelmi LLM. Ako funguje ChatGPT? Čo je to LLAMA? Napíšte si poznámky.
|
||
|
- Nainštalujte si Anaconda.
|
||
|
- Pokračujte v štúdiu Python. Preštudujte si knihu Dive deep into deep learning.
|
||
|
- Nainštalujte si knižnicu Huggingface Transformers. Vyskúšajte LLM model LLAMA https://huggingface.co/meta-llama/Llama-2-70b
|
||
|
- Prejdite si tento tutoriál https://huggingface.co/blog/llama2
|