4 lines
832 B
Plaintext
4 lines
832 B
Plaintext
|
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 855/855 [4:39:17<00:00, 19.60s/it]
|
||
|
{'loss': inf, 'grad_norm': nan, 'learning_rate': 2e-05, 'epoch': 2.92}
|
||
|
{'train_runtime': 16759.0519, 'train_samples_per_second': 3.27, 'train_steps_per_second': 0.051, 'train_loss': nan, 'epoch': 4.99}
|