--- title: Denis Le Thanh published: true taxonomy: category: [bp2026] tag: [lm,nlp] author: Daniel Hladek --- rok začiatku štúdia: 2023 študent KPI vedúci Ing. Tomáš Kormaník konzultácie: Ing. Kristián Sopkovič # Bakalárska práca 2026 Téma: Trénovanie jazykového modelu pre spracovanie inštrukcií v prirodzenom jazyku Ciele: - Skúsiť dotrénovať slovenský generatívny model (slovak-mistral-7b) pre inštrukcie. Stretnutie 26.2. Úlohy: - Oboznámte sa s problematikou veľkých jazykových modelov. Towards Data Science - Naučte sa Python lepšie. Nainštalujte si prostredie Anaconda. - Poučte sa o strojovom účení. Dive into deep learning. - Vyskúšajte si framework HF Transformers. - Vyskúšajte si veľký jazykový model, napr. cez systém OLLAMA. - Oboznámte sa s repozitárom https://github.com/allenai/open-instruct, prečítajte si články - Oboznámte sa s repozitárom https://github.com/nlp-uoregon/Okapi, prečítajte si články Zásobník úloh: - Strojovo preložte vybranú množinu inštrukcií a použite ju v trénovaní. - Vyhodnotte výsledný model a porovnajte ho.