diff --git a/pages/students/2021/eduard_matovka/README.md b/pages/students/2021/eduard_matovka/README.md index 8c21c413..b6ddaeaf 100644 --- a/pages/students/2021/eduard_matovka/README.md +++ b/pages/students/2021/eduard_matovka/README.md @@ -41,7 +41,8 @@ Stav - Prezentácia - Skript na trénovanie funguje na vlastnom 3060Ti 8GB, funguje aj LLAMA 7B 4bit -- Natrénované na Instruct datasete. +- Natrénované na Instruct (SlovakAlpaca) datasete. +- Tento dataset je doplnený o dáta z redditu - r/Slovak. - jedno trénovanie na malom datasete trvalo 28 hod. Trénovanie sa podarilo - zbežná kontrola je ok. - Prečistenie textov pre výskyt vulgarizmov. - Začal "študovať" evaluate.