training_scripts/run_grpo_video_cls_qa.sh 这个训练脚本中训练集格式是什么样的? 自己的数据集如何制作才能训练 可以给一个数据集参考样例?
training_scripts/run_grpo_video_cls_qa.sh
这个训练脚本中训练集格式是什么样的?
自己的数据集如何制作才能训练
可以给一个数据集参考样例?