From e10c0c8896cfea04160b6a074ef248ce6c789872 Mon Sep 17 00:00:00 2001 From: dano Date: Thu, 7 Dec 2023 09:04:11 +0000 Subject: [PATCH] Update 'pages/students/2018/adrian_remias/README.md' --- pages/students/2018/adrian_remias/README.md | 5 ++++- 1 file changed, 4 insertions(+), 1 deletion(-) diff --git a/pages/students/2018/adrian_remias/README.md b/pages/students/2018/adrian_remias/README.md index b14210c9..c3c51e95 100644 --- a/pages/students/2018/adrian_remias/README.md +++ b/pages/students/2018/adrian_remias/README.md @@ -57,7 +57,8 @@ Stav: Zásobník úloh: -- Dotrénujte neurónovú sieť na úlohu dopňlňania interpunkcie. Úloha je formulovaná ako "klasifikácia postupností" a je podobná úlohám "part of speech tagging" alebo "named entity recognition". Pokračujte v prieskume literatúry na túto tému a robte si poznámky o prístupoch. +- Dotrénujte neurónovú sieť na úlohu dopňlňania interpunkcie. Úloha je formulovaná ako "klasifikácia postupností" a je podobná úlohám "part of speech tagging" alebo "named entity recognition". Pokračujte v prieskume literatúry na túto tému a robte si poznámky o prístupoch. +- Podrobné {vysvetlenie](https://medium.com/@alexmriggio/bert-for-sequence-classification-from-scratch-code-and-theory-fb88053800fa). Takto by mala vyzerať trénovacia množina. @@ -66,6 +67,8 @@ x x x . , x x . Dnes je pekný den Povedala že ostane doma ``` +- Môžete využiť [skripty](https://github.com/huggingface/transformers/tree/main/examples/pytorch/token-classification). Tam je potrebn0 správne pripraviť dátovú množinu tak, aby na ľavej strane bole len slová a na pravej strane bola ku kažnédmu slovu pridelená trieda. Formát by mal byť JSON, na jeden riadok jeden dokument, zrozumiteľný pre HF datasets. + Stretnutie 23.11.2023 Stav: