Skip to content

请问cold start阶段如何复现? #1

@syr-cn

Description

@syr-cn

你好,感谢你们的工作!

我注意到EvolveR的RL训练阶段是从一个sft模型开始的,但是对应的sft模型仅放出了对应的ckpt,并没有放出训练recipe。

请问对应的训练方法、数据管线是否可以开源?这对我们复现、改进这个工作会有很大助力。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions