forked from KEMT/zpwiki
Update 'pages/topics/bert/README.md'
This commit is contained in:
parent
3e3603a0cf
commit
1ef18587e3
@ -47,6 +47,7 @@ author: Daniel Hládek
|
||||
- Electra small 512/32 batch funguje na Titane.
|
||||
- Spotrebu pamäte ovplyvňujú veľkosť vstupného vektora, veľkosť trénovacej dávky.
|
||||
- V SLovak Bert bola veľkosť vstupného vektora 512. Máme toľko pamäte?
|
||||
- learning rate by malo byť priamo úmerné s batch_size. Malý batch size by mal mať malý learning rate.
|
||||
|
||||
## Budúci výskum
|
||||
|
||||
|
Loading…
Reference in New Issue
Block a user