请问cold start阶段如何复现?

你好，感谢你们的工作！

我注意到EvolveR的RL训练阶段是从一个sft模型开始的，但是对应的sft模型仅放出了对应的ckpt，并没有放出训练recipe。

请问对应的训练方法、数据管线是否可以开源？这对我们复现、改进这个工作会有很大助力。