Update 'pages/students/2018/adrian_remias/README.md'

2023-12-07 09:04:11 +00:00 · 2023-12-07 09:04:11 +00:00 · e10c0c8896
commit e10c0c8896
parent 2f21819f22
1 changed files with 4 additions and 1 deletions
--- a/pages/students/2018/adrian_remias/README.md
+++ b/pages/students/2018/adrian_remias/README.md
@ -57,7 +57,8 @@ Stav:

 Zásobník úloh:

- Dotrénujte neurónovú sieť na úlohu dopňlňania interpunkcie. Úloha je formulovaná ako "klasifikácia postupností" a je podobná úlohám "part of speech tagging" alebo "named entity recognition". Pokračujte v prieskume literatúry na túto tému a robte si poznámky o prístupoch.
+- Dotrénujte neurónovú sieť na úlohu dopňlňania interpunkcie. Úloha je formulovaná ako "klasifikácia postupností" a je podobná úlohám "part of speech tagging" alebo "named entity recognition". Pokračujte v prieskume literatúry na túto tému a robte si poznámky o prístupoch. 
+- Podrobné {vysvetlenie](https://medium.com/@alexmriggio/bert-for-sequence-classification-from-scratch-code-and-theory-fb88053800fa).

 Takto by mala vyzerať trénovacia množina.

@ -66,6 +67,8 @@ x     x    x    .        ,  x     x     .
 Dnes je pekný den Povedala že ostane doma
 ``` 

+- Môžete využiť [skripty](https://github.com/huggingface/transformers/tree/main/examples/pytorch/token-classification). Tam je potrebn0 správne pripraviť dátovú množinu tak, aby na ľavej strane bole len slová a na pravej strane bola ku kažnédmu slovu pridelená trieda. Formát by mal byť JSON, na jeden riadok jeden dokument, zrozumiteľný pre HF datasets.
+
 Stretnutie 23.11.2023

 Stav: