From 0c78264b7d582033b5b5effac81b94b4f72ce873 Mon Sep 17 00:00:00 2001 From: dano Date: Fri, 5 Dec 2025 09:58:00 +0000 Subject: [PATCH] Update pages/students/2023/simona_bobrovcanova/README.md --- pages/students/2023/simona_bobrovcanova/README.md | 12 ++++++++++++ 1 file changed, 12 insertions(+) diff --git a/pages/students/2023/simona_bobrovcanova/README.md b/pages/students/2023/simona_bobrovcanova/README.md index e203f551f..6386673aa 100644 --- a/pages/students/2023/simona_bobrovcanova/README.md +++ b/pages/students/2023/simona_bobrovcanova/README.md @@ -32,6 +32,18 @@ Stav: - Pripravený skript na LORA dotrénovanie. - Vyhodnotenie pomocou ROUGE and BLEU. - Dotrénované a vyhodnotené modely slovak-mistral 7B., Qwen3 , Gemma, Slovak-t5-base +- Vyzerá to tak, že problémom je dĺžka kontextu. Modely často vynechajú informácie na konci. + +Úlohy: + +- Možné riešenie problému s kontextom je "hierarchická sumarizácia" - model najprv sumarizuje na kratších častiach a potom spojí výsledky do jedného. Sú aj iné spôsoby riešenia? (napr. pomocou vektorových modelov) Toto je možné napísať do prehľadu. +- Vypracujte automatické vyhodnotenie sumarizácie pomocu jazykového modelu. Vedúci dodá skript . +- Vyskúšajte "zero shot prístup" pomocou "veľkého jazykového modelu". Porovnajte veľký model a dotrénované modely. +- Výsledky experimentov dajte do tabuľky. + +Zásobník úloh: + +- Implementujte niektorý prístup na prácu s veľkým kontextom. Stretnutie 6.10.2025