From b1cf1e685725fae0042fb2d6d72c06f8550dde6a Mon Sep 17 00:00:00 2001 From: dano Date: Fri, 11 Mar 2022 10:12:07 +0000 Subject: [PATCH] Update 'pages/students/2018/ondrej_megela/README.md' --- pages/students/2018/ondrej_megela/README.md | 15 +++++++++++++++ 1 file changed, 15 insertions(+) diff --git a/pages/students/2018/ondrej_megela/README.md b/pages/students/2018/ondrej_megela/README.md index eef5efb5c..afb3a2085 100644 --- a/pages/students/2018/ondrej_megela/README.md +++ b/pages/students/2018/ondrej_megela/README.md @@ -26,6 +26,8 @@ Cieľ: 11.3. +- Vyskúšaný GPT na cloab, zatiaľ nefunguje kvôli pamäti. + Možné spôsoby využitia generatívnych modelov: - mnli - multi natural language inference - textual entailment and contradiction, zero shot classification @@ -34,6 +36,19 @@ Možné spôsoby využitia generatívnych modelov: - konverzačné systémy - generovanie odpovede na otázku - generovanie otázok ku zadanému odseku (reverse squad) +Možné spôsoby vytvorenia overovacej množiny: + +- Využitie slovenského squadu pre úlohu generovania otázok. +- Strojový preklad existujúceho jazykového zdroja do slovenčiny. +- Pokúsime sa vytvoriť vlastnú dátovú množinu od začiatku. Pre ktorú úlohu? +- Na overenie použijeme existujúci paralelný korpus - to si vyžaduje fine-tuning pre strojový preklad. +- Strojovo vytvoríme overovaciu databázu pre úlohu sumarizácie. Zoberieme novinové články alebo vedecké články alebo záverečné práce ktoré majú uvedený abstrakt. + + +Úlohy: + +- vyskúšať menší GPT model + 25.2. - Vytvorený textový report, kde je urobený prehľad metód vyhodnotenia a niekoľkých testovacích korpusov a benchmarkov. Rouge je používaná metrika.