From 020dc8ca83ab7d06db97dfa48248f4d85ef0e532 Mon Sep 17 00:00:00 2001 From: Daniel Hladek Date: Thu, 26 Jun 2025 09:34:22 +0200 Subject: [PATCH] zz --- pages/home/default.md | 25 +++++++++++----------- pages/interns/yussef_ressaissi/README.md | 27 ++++++++++++++++++++++++ 2 files changed, 39 insertions(+), 13 deletions(-) create mode 100644 pages/interns/yussef_ressaissi/README.md diff --git a/pages/home/default.md b/pages/home/default.md index f51dccb7..771cb4f3 100644 --- a/pages/home/default.md +++ b/pages/home/default.md @@ -16,17 +16,14 @@ Wiki stánka pre spoluprácu na záverečných prácach. - [Ako napíšem záverečnú prácu](/topics/akopisat) - [Prostredie Anaconda a jazyk Python pre strojové učenie](/topics/python) -## Vedúci - -- [Daniel Hládek](/authors/daniel-hladek) -- [Maroš Harahus](/authors/maros-harahus) - ## Predmety -- [Diplomové práce 2025](https://zp.kemt.fei.tuke.sk/taxonomy?name=category&val=dp2025) -- [Bakalárske práce 2025](https://zp.kemt.fei.tuke.sk/taxonomy?name=category&val=bp2025) +- [Diplomové práce 2026](https://zp.kemt.fei.tuke.sk/taxonomy?name=category&val=dp2026) +- [Bakalárske práce 2026](https://zp.kemt.fei.tuke.sk/taxonomy?name=category&val=bp2026) -## Vedecké projekty + + +## Ukončené projekty - [Dialógový systém](/topics/chatbot) - Rozpoznávanie nenávistnej reči (Hate Speech Detection) @@ -35,9 +32,6 @@ Wiki stánka pre spoluprácu na záverečných prácach. - [Projektová stránka](/topics/named-entity) - [Anotujte korpus](/topics/named-entity/navod) - [Ostatné projekty](/categories/projects) - -## Ukončené projekty - - [Podpora slovenčiny v knižnici Spacy](/topics/spacy) - [Slovenský BERT model](/topics/bert) - [AI4Steel](/topics/steel) @@ -49,10 +43,15 @@ Wiki stánka pre spoluprácu na záverečných prácach. ## Uzavreté predmety +## 2025 + +- [Diplomové práce 2025](https://zp.kemt.fei.tuke.sk/taxonomy?name=category&val=dp2025) +- [Bakalárske práce 2025](https://zp.kemt.fei.tuke.sk/taxonomy?name=category&val=bp2025) + ## 2024 -- [Diplomové práce 2024](/categories/dp2024) -- [Bakalárske práce 2024](/categories/bp2024) +- [Diplomové práce 2024](https://zp.kemt.fei.tuke.sk/taxonomy?name=category&val=dp2024) +- [Bakalárske práce 2024](https://zp.kemt.fei.tuke.sk/taxonomy?name=category&val=bp2024) ## 2023 diff --git a/pages/interns/yussef_ressaissi/README.md b/pages/interns/yussef_ressaissi/README.md new file mode 100644 index 00000000..c805ed90 --- /dev/null +++ b/pages/interns/yussef_ressaissi/README.md @@ -0,0 +1,27 @@ +--- +title: Youssef Ressaissi +published: true +taxonomy: + category: [iaeste] + tag: [summarization,nlp] + author: Daniel Hladek +--- + + +IAESTE Intern Summer 2025, 1.7. - 31.8.2025 + +Goal: Evaluate and improve language models for summarization in Slovak medical or legal domain. + + +Tasks: + +- Get familiar with basic tools and prepare working environment: HF transformers, datasets, lm-evaluation-harness, HF trl +- Read several recent papers about summarization using LLM and write a report. +- Get familiar how to perform and evaluate document summarization using language models in Slovak. +- Pick summarization datasets and models. Evaluate several models for evaluation using ROUGE and BLEU metrics. +- Describe the experiments. Summarize results in a table. Describe the results. +- Improve performance of a languge model. Use more data. Prepare a domain-oriented dataset and finetune a model. Maybe generate artificial data to imporve summarization. +- Run new expriments and write down the results. +- Publish the fine-tuned models in HF HUB. Publish the paper from the project. + +