site stats
Kimi 数学版今晚上线!o1 出来之后,强化学习的范式已经成为业界共识。最近有三家公司都推出了自己的对标 o1 的模型,分别是月之暗面的 k0-math,Deepseek 的 R1 Lite,阿里巴巴的 Macro o1.其中 k0-math 是最早发布的,重点优化了数学方面,在多项考试类测试集中都超过了 o1-preview。
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多