From 6d5579ab93f03f055d56b80b3c4be94e9bbe2702 Mon Sep 17 00:00:00 2001 From: dano Date: Fri, 20 Jan 2023 12:33:38 +0000 Subject: [PATCH] Update 'pages/students/2020/matus_suchanic/README.md' --- pages/students/2020/matus_suchanic/README.md | 10 ++++++++++ 1 file changed, 10 insertions(+) diff --git a/pages/students/2020/matus_suchanic/README.md b/pages/students/2020/matus_suchanic/README.md index 9a24052b..f25ddae1 100644 --- a/pages/students/2020/matus_suchanic/README.md +++ b/pages/students/2020/matus_suchanic/README.md @@ -39,6 +39,16 @@ Stav: - Prečítané články, urobený report na cca 7 strán. +Úlohy: + +- Boli vedúcim poskytnuté dáta, ktoré obsahujú názvy článkov, kategórie, aj texty článkov. +- Urobte skript, ktorý spojí dáta tak, aby boli dáta spolu - názov, text a zoznam kategórií. +- Natrénujte na týchto dátach neurónovú sieť pre kategorizáciu článkov. +- Vedúci Vám poskytne ďalšiu množinu v takom istom formáte s vyhodnocovacími dátami. Na tejto množine to vyhodnotíte. Alebo rozdeľte trénovaciu množinu na dve časti a vyhodnocovaciu množinu dajte stranou. +- Na klasifikáciu použite: toolkit transformers, model slovakbert, alebo model slovak gpt, slovak t5 +- Začnite písať BP. Do práce dajte definíciu úlohy a zoznam metód, ktorou sa táto úloha rieši. Vysvetlite, ako funguje klasifikácia dokumentov pomocou modelu BERT alebo Roberta, a GPT. +Opíšte experiment - použitý model, použité dáta, spôsob vyhodnotenia a výsledky. Napíšte čo z toho vyplýva - kde je priestor na zlepšenie. + Stretnutie 28.10.2022 Stav: