Did you have exploding gradients (loss = nan)? #95

vetka925 · 2023-03-20T12:23:04Z

vetka925
Mar 20, 2023

I tried to fine-tune LLaMA with LoRA on my dataset. Firstly, it has learnt good - loss decreased. But after a few hundred steps loss started increasing and became nan.

AngainorDev · 2023-03-25T15:03:53Z

AngainorDev
Mar 25, 2023

This would usually point to either a noisy dataset, either too high a LR.

Make sure the various settings, like warmup and batch size are consistent with your dataset size.

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Did you have exploding gradients (loss = nan)? #95

{{title}}

Replies: 1 comment

{{title}}

Select a reply

Did you have exploding gradients (loss = nan)? #95

vetka925 Mar 20, 2023

Replies: 1 comment

AngainorDev Mar 25, 2023

vetka925
Mar 20, 2023

AngainorDev
Mar 25, 2023