100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 594/594 [1:43:00<00:00, 10.41s/it] {'loss': inf, 'grad_norm': nan, 'learning_rate': 2e-05, 'epoch': 2.52} {'train_runtime': 6182.0596, 'train_samples_per_second': 6.171, 'train_steps_per_second': 0.096, 'train_loss': nan, 'epoch': 2.99}