diff --git a/pages/students/2018/ondrej_megela/README.md b/pages/students/2018/ondrej_megela/README.md index eef5efb5c..afb3a2085 100644 --- a/pages/students/2018/ondrej_megela/README.md +++ b/pages/students/2018/ondrej_megela/README.md @@ -26,6 +26,8 @@ Cieľ: 11.3. +- Vyskúšaný GPT na cloab, zatiaľ nefunguje kvôli pamäti. + Možné spôsoby využitia generatívnych modelov: - mnli - multi natural language inference - textual entailment and contradiction, zero shot classification @@ -34,6 +36,19 @@ Možné spôsoby využitia generatívnych modelov: - konverzačné systémy - generovanie odpovede na otázku - generovanie otázok ku zadanému odseku (reverse squad) +Možné spôsoby vytvorenia overovacej množiny: + +- Využitie slovenského squadu pre úlohu generovania otázok. +- Strojový preklad existujúceho jazykového zdroja do slovenčiny. +- Pokúsime sa vytvoriť vlastnú dátovú množinu od začiatku. Pre ktorú úlohu? +- Na overenie použijeme existujúci paralelný korpus - to si vyžaduje fine-tuning pre strojový preklad. +- Strojovo vytvoríme overovaciu databázu pre úlohu sumarizácie. Zoberieme novinové články alebo vedecké články alebo záverečné práce ktoré majú uvedený abstrakt. + + +Úlohy: + +- vyskúšať menší GPT model + 25.2. - Vytvorený textový report, kde je urobený prehľad metód vyhodnotenia a niekoľkých testovacích korpusov a benchmarkov. Rouge je používaná metrika.