zpwiki/pages/students/2023/denis_le_thanh/README.md
2025-02-26 14:34:43 +01:00

1.1 KiB

title published taxonomy
Denis Le Thanh true
category tag author
bp2026
lm
nlp
Daniel Hladek

rok začiatku štúdia: 2023

študent KPI

vedúci Ing. Tomáš Kormaník

konzultácie: Ing. Kristián Sopkovič

Bakalárska práca 2026

Téma:

Trénovanie jazykového modelu pre spracovanie inštrukcií v prirodzenom jazyku

Ciele:

  • Skúsiť dotrénovať slovenský generatívny model (slovak-mistral-7b) pre inštrukcie.

Stretnutie 26.2.

Úlohy:

  • Oboznámte sa s problematikou veľkých jazykových modelov. Towards Data Science
  • Naučte sa Python lepšie. Nain3talujte si prostredie Anaconda.
  • Poučte sa o strojovom účení. Dive into deep learning.
  • Vyskúšajte si framework HF Transformers.
  • Vyskúšajte si veľký jazykový model, napr. cez systém OLLAMA.
  • Oboznámte sa s repozitárom https://github.com/allenai/open-instruct, prečítajte si články
  • Oboznámte sa s repozitárom https://github.com/nlp-uoregon/Okapi, prečítajte si články

Zásobník úloh:

  • Strojovo preložte vybranú množinu inštrukcií a použite ju v trénovaní.
  • Vyhodnotte výsledný model a porovnajte ho.