From aa5d4e104db21823149068888d95bc039057e3c3 Mon Sep 17 00:00:00 2001 From: Daniel Hladek Date: Thu, 3 Apr 2025 13:19:40 +0200 Subject: [PATCH] zz --- .../2023/simona_bobrovcanova/README.md | 44 +++++++++++++++++++ 1 file changed, 44 insertions(+) create mode 100644 pages/students/2023/simona_bobrovcanova/README.md diff --git a/pages/students/2023/simona_bobrovcanova/README.md b/pages/students/2023/simona_bobrovcanova/README.md new file mode 100644 index 000000000..de2f08d55 --- /dev/null +++ b/pages/students/2023/simona_bobrovcanova/README.md @@ -0,0 +1,44 @@ +--- +title: Simona Bobrovčanová +published: true +taxonomy: + category: [bp2026] + tag: [lm,nlp] + author: Daniel Hladek +--- + + +rok začiatku štúdia: 2023 + + +# Bakalárska práca 2026 + + +Téma: + +Automatická sumarizácia slovenského textu + +Ciele: + +Zlepšite spracovanie slovenkých právnych textov - vytvorte systém pre sumarizáciu rozsudkov alebo iných právnych dokumentov. + +Stretnutie 3.4. + +Úlohy: + +- Oboznámte sa s problematikou veľkých jazykových modelov. Towards Data Science +- Naučte sa Python lepšie. Nainštalujte si prostredie Anaconda. +- Poučte sa o strojovom účení. Dive into deep learning. +- Vyskúšajte si framework HF Transformers. +- Vyskúšajte si veľký jazykový model, napr. cez systém OLLAMA. +- Oboznámte sa so stránkou otvorenesudy.sk +- Zistite, ako vieme dotrénovať jazykový model. Zistite čo je to metóda PEFT, čo je to Supervised finetuning. +- Oboznámte sa s databázou https://huggingface.co/datasets/NaiveNeuron/slovaksum +- Napíšte si poznámky z vecí ktoré ste sa naučili. + +Zásobník úloh: + + +- Spracujte slovenské súdne dáta, upravte ich do podoby vhodnej na trénovanie jazykového modelu +- Natrénujte a vyhodnotte model pre úlohu sumarizácie. +