zz
This commit is contained in:
parent
ce97d6ed40
commit
aa5d4e104d
44
pages/students/2023/simona_bobrovcanova/README.md
Normal file
44
pages/students/2023/simona_bobrovcanova/README.md
Normal file
@ -0,0 +1,44 @@
|
|||||||
|
---
|
||||||
|
title: Simona Bobrovčanová
|
||||||
|
published: true
|
||||||
|
taxonomy:
|
||||||
|
category: [bp2026]
|
||||||
|
tag: [lm,nlp]
|
||||||
|
author: Daniel Hladek
|
||||||
|
---
|
||||||
|
|
||||||
|
|
||||||
|
rok začiatku štúdia: 2023
|
||||||
|
|
||||||
|
|
||||||
|
# Bakalárska práca 2026
|
||||||
|
|
||||||
|
|
||||||
|
Téma:
|
||||||
|
|
||||||
|
Automatická sumarizácia slovenského textu
|
||||||
|
|
||||||
|
Ciele:
|
||||||
|
|
||||||
|
Zlepšite spracovanie slovenkých právnych textov - vytvorte systém pre sumarizáciu rozsudkov alebo iných právnych dokumentov.
|
||||||
|
|
||||||
|
Stretnutie 3.4.
|
||||||
|
|
||||||
|
Úlohy:
|
||||||
|
|
||||||
|
- Oboznámte sa s problematikou veľkých jazykových modelov. Towards Data Science
|
||||||
|
- Naučte sa Python lepšie. Nainštalujte si prostredie Anaconda.
|
||||||
|
- Poučte sa o strojovom účení. Dive into deep learning.
|
||||||
|
- Vyskúšajte si framework HF Transformers.
|
||||||
|
- Vyskúšajte si veľký jazykový model, napr. cez systém OLLAMA.
|
||||||
|
- Oboznámte sa so stránkou otvorenesudy.sk
|
||||||
|
- Zistite, ako vieme dotrénovať jazykový model. Zistite čo je to metóda PEFT, čo je to Supervised finetuning.
|
||||||
|
- Oboznámte sa s databázou https://huggingface.co/datasets/NaiveNeuron/slovaksum
|
||||||
|
- Napíšte si poznámky z vecí ktoré ste sa naučili.
|
||||||
|
|
||||||
|
Zásobník úloh:
|
||||||
|
|
||||||
|
|
||||||
|
- Spracujte slovenské súdne dáta, upravte ich do podoby vhodnej na trénovanie jazykového modelu
|
||||||
|
- Natrénujte a vyhodnotte model pre úlohu sumarizácie.
|
||||||
|
|
Loading…
Reference in New Issue
Block a user