zpwiki/pages/students/2020/pavol_hudak/README.md

33 lines
897 B
Markdown
Raw Normal View History

2024-02-14 11:00:10 +00:00
---
title: Pavol Hudák
published: true
taxonomy:
category: [dp2025]
tag: [ir]
author: Daniel Hladek
---
rok začiatku štúdia: 2020
# Diplomová práca 2025
Ciel:
Vylepšiť slovenský veľký jazykový model.
Vybrať jednu z úloh:
- Tvorba instruct datasetu - Anotácia alebo preklad množín
- Dotrénvanie LLM na dostupnom hardvéri - LORA-PEFT
- Rozpoznávanie nenávistnej reči (pomocou LLM?, prompting, finetuning)
Stretnutie 14.2.
Úlohy:
- Oboznámiť sa s veľkými jazykovými modelmi LLM. Ako funguje ChatGPT? Čo je to LLAMA? Napíšte si poznámky.
- Nainštalujte si Anaconda.
- Pokračujte v štúdiu Python. Preštudujte si knihu Dive deep into deep learning.
- Nainštalujte si knižnicu Huggingface Transformers. Vyskúšajte LLM model LLAMA https://huggingface.co/meta-llama/Llama-2-70b
- Prejdite si tento tutoriál https://huggingface.co/blog/llama2