forked from KEMT/zpwiki
Update 'pages/students/2018/adrian_remias/README.md'
This commit is contained in:
parent
2f21819f22
commit
e10c0c8896
@ -58,6 +58,7 @@ Stav:
|
|||||||
Zásobník úloh:
|
Zásobník úloh:
|
||||||
|
|
||||||
- Dotrénujte neurónovú sieť na úlohu dopňlňania interpunkcie. Úloha je formulovaná ako "klasifikácia postupností" a je podobná úlohám "part of speech tagging" alebo "named entity recognition". Pokračujte v prieskume literatúry na túto tému a robte si poznámky o prístupoch.
|
- Dotrénujte neurónovú sieť na úlohu dopňlňania interpunkcie. Úloha je formulovaná ako "klasifikácia postupností" a je podobná úlohám "part of speech tagging" alebo "named entity recognition". Pokračujte v prieskume literatúry na túto tému a robte si poznámky o prístupoch.
|
||||||
|
- Podrobné {vysvetlenie](https://medium.com/@alexmriggio/bert-for-sequence-classification-from-scratch-code-and-theory-fb88053800fa).
|
||||||
|
|
||||||
Takto by mala vyzerať trénovacia množina.
|
Takto by mala vyzerať trénovacia množina.
|
||||||
|
|
||||||
@ -66,6 +67,8 @@ x x x . , x x .
|
|||||||
Dnes je pekný den Povedala že ostane doma
|
Dnes je pekný den Povedala že ostane doma
|
||||||
```
|
```
|
||||||
|
|
||||||
|
- Môžete využiť [skripty](https://github.com/huggingface/transformers/tree/main/examples/pytorch/token-classification). Tam je potrebn0 správne pripraviť dátovú množinu tak, aby na ľavej strane bole len slová a na pravej strane bola ku kažnédmu slovu pridelená trieda. Formát by mal byť JSON, na jeden riadok jeden dokument, zrozumiteľný pre HF datasets.
|
||||||
|
|
||||||
Stretnutie 23.11.2023
|
Stretnutie 23.11.2023
|
||||||
|
|
||||||
Stav:
|
Stav:
|
||||||
|
Loading…
Reference in New Issue
Block a user