zpwiki/pages/students/2023/denis_le_thanh/README.md

50 lines
1.1 KiB
Markdown
Raw Normal View History

2025-02-26 13:29:15 +00:00
---
title: Denis Le Thanh
published: true
taxonomy:
category: [bp2026]
tag: [lm,nlp]
author: Daniel Hladek
---
rok začiatku štúdia: 2023
2025-02-26 13:34:43 +00:00
študent KPI
vedúci Ing. Tomáš Kormaník
konzultácie: Ing. Kristián Sopkovič
2025-02-26 13:29:15 +00:00
# Bakalárska práca 2026
Téma:
Trénovanie jazykového modelu pre spracovanie inštrukcií v prirodzenom jazyku
Ciele:
- Skúsiť dotrénovať slovenský generatívny model (slovak-mistral-7b) pre inštrukcie.
Stretnutie 26.2.
Úlohy:
- Oboznámte sa s problematikou veľkých jazykových modelov. Towards Data Science
2025-02-26 13:52:13 +00:00
- Naučte sa Python lepšie. Nainštalujte si prostredie Anaconda.
2025-02-26 13:29:15 +00:00
- Poučte sa o strojovom účení. Dive into deep learning.
- Vyskúšajte si framework HF Transformers.
- Vyskúšajte si veľký jazykový model, napr. cez systém OLLAMA.
- Oboznámte sa s repozitárom https://github.com/allenai/open-instruct, prečítajte si články
- Oboznámte sa s repozitárom https://github.com/nlp-uoregon/Okapi, prečítajte si články
Zásobník úloh:
2025-02-26 13:34:43 +00:00
- Strojovo preložte vybranú množinu inštrukcií a použite ju v trénovaní.
2025-02-26 13:29:15 +00:00
- Vyhodnotte výsledný model a porovnajte ho.