4 lines
833 B
Plaintext
4 lines
833 B
Plaintext
100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 990/990 [3:18:29<00:00, 12.03s/it]
|
|
{'loss': inf, 'grad_norm': nan, 'learning_rate': 2e-05, 'epoch': 2.52}
|
|
{'train_runtime': 11910.6695, 'train_samples_per_second': 5.338, 'train_steps_per_second': 0.083, 'train_loss': nan, 'epoch': 4.98}
|