forked from KEMT/zpwiki
Update pages/students/2022/andrii_pervashov/README.md
This commit is contained in:
parent
1dbfb5636b
commit
3e926981ea
@ -27,13 +27,24 @@ Stretnutie 22.11.2024
|
||||
Stav:
|
||||
|
||||
- WikiEdits nefunguje.
|
||||
- Trénovanie na korpuse 1 kníh. Program zmení písmená, urobí gramatické chyby. Problém je v tom, že dát na natrénovanie je málo.
|
||||
- Trénovanie na korpuse 1 kníh. Program zmení písmená, urobí gramatické chyby. Problém je v tom, že dát na natrénovanie je málo. BLEU ROUGE nie sú dobré metriky.
|
||||
- Na trénovanie sa používa mt5-large.
|
||||
- Konzultácia Ing. Harahusom PhD.
|
||||
- Trénovanie modelu.
|
||||
|
||||
Úlohy:
|
||||
|
||||
- Pokračujte v písaní podľa pokynov nižšie.
|
||||
- Implemenujte metódu vyhodnotenia WER-CER-SER. Použite Python balíček alebo ex. kód. python-levenshtein.
|
||||
- Vyhodnnotte model "zero shot" - bez dotrénovnaia. Vyhodnotte viac modelov. Môžťete vyskúšať aj Slovak Falcon, slovak t5 base.
|
||||
- Pokračujte s "base modelmi".
|
||||
- Vyskúšajte opravu textu pomocou "promptu". Použite veľký jazykový model. Vyberte vhodný, napr. chatgpt alebo iný.
|
||||
|
||||
Zásobník úloh:
|
||||
|
||||
- Dotrénujte model typu t5-base na väčšom množstve dát. MNôžete použiť webový korpus - mc4.
|
||||
|
||||
|
||||
|
||||
|
||||
Stretnutie 3.10.2024
|
||||
|
Loading…
Reference in New Issue
Block a user