2025-02-26 13:29:15 +00:00
|
|
|
---
|
|
|
|
title: Denis Le Thanh
|
|
|
|
published: true
|
|
|
|
taxonomy:
|
|
|
|
category: [bp2026]
|
|
|
|
tag: [lm,nlp]
|
|
|
|
author: Daniel Hladek
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
|
|
rok začiatku štúdia: 2023
|
|
|
|
|
2025-02-26 13:34:43 +00:00
|
|
|
študent KPI
|
|
|
|
|
|
|
|
vedúci Ing. Tomáš Kormaník
|
|
|
|
|
|
|
|
konzultácie: Ing. Kristián Sopkovič
|
|
|
|
|
2025-02-26 13:29:15 +00:00
|
|
|
# Bakalárska práca 2026
|
|
|
|
|
|
|
|
|
|
|
|
Téma:
|
|
|
|
|
|
|
|
Trénovanie jazykového modelu pre spracovanie inštrukcií v prirodzenom jazyku
|
|
|
|
|
|
|
|
|
|
|
|
Ciele:
|
|
|
|
|
|
|
|
- Skúsiť dotrénovať slovenský generatívny model (slovak-mistral-7b) pre inštrukcie.
|
|
|
|
|
|
|
|
Stretnutie 26.2.
|
|
|
|
|
|
|
|
Úlohy:
|
|
|
|
|
|
|
|
|
|
|
|
- Oboznámte sa s problematikou veľkých jazykových modelov. Towards Data Science
|
2025-02-26 13:52:13 +00:00
|
|
|
- Naučte sa Python lepšie. Nainštalujte si prostredie Anaconda.
|
2025-02-26 13:29:15 +00:00
|
|
|
- Poučte sa o strojovom účení. Dive into deep learning.
|
|
|
|
- Vyskúšajte si framework HF Transformers.
|
|
|
|
- Vyskúšajte si veľký jazykový model, napr. cez systém OLLAMA.
|
|
|
|
- Oboznámte sa s repozitárom https://github.com/allenai/open-instruct, prečítajte si články
|
|
|
|
- Oboznámte sa s repozitárom https://github.com/nlp-uoregon/Okapi, prečítajte si články
|
|
|
|
|
|
|
|
Zásobník úloh:
|
|
|
|
|
2025-02-26 13:34:43 +00:00
|
|
|
- Strojovo preložte vybranú množinu inštrukcií a použite ju v trénovaní.
|
2025-02-26 13:29:15 +00:00
|
|
|
- Vyhodnotte výsledný model a porovnajte ho.
|
|
|
|
|
|
|
|
|