Skip to content

节省显存篇

注意以下命令

参数名用处建议调整
--per_device_train_batch_size每设备训练批次大小若显存小建议1-2,若大显存可以4及以上
--per_device_eval_batch_size每设备验证批次大小同上
--gradient_accumulation_steps梯度累积步数显存小:4-16,显存大则降低