Kimi 数学版今晚上线!
o1 出来之后,强化学习的范式已经成为业界共识。最近有三家公司都推出了自己的对标 o1 的模型,分别是月之暗面的 k0-math,Deepseek 的 R1 Lite,阿里巴巴的 Macro o1.
其中 k0-math 是最早发布的,重点优化了数学方面,在多项考试类测试集中都超过了 o1-preview。
很多人听到数学模型的第一反应是做高考题之类的,其实生活中很多地方都需要用到数学,购物算价格、健身算卡路里、产品经理算增长数据,等等。
接下来为大家分享几个我测试的例子。这部分问题之前大模型的数学能力难以解决,但是在今天学会数学后能去做更多的事情
第一道题,首先我们还是从最经典的题目开始,9.8和9.11谁更大?
第二道题,我们来算一个强迫症购物的问题
有个人想买几套餐具,到了店里发现,自己的钱可以买21把叉子和21个勺子,也够买28个小刀,但是,他想三样东西都买,而且要配成一套,并且把钱刚好花完,如果你是这个人,你会怎么买呢?
第三道题,我们来算一下减肥5kg大概需要几天
请根据下列情况计算减肥的话,需要摄入的每日卡路里量,并推算减肥需要几天。男性,少量运动,当前体重 80kg 身高 180cm 年龄30 减肥目标5kg
第四道题,我们来算一下获得100万用户的节奏
一个产品一年的目标是100万用户,假设每个月新用户的增长是上个月的150%,请分别计算每个月应该获取的用户数
点击图片查看原图
点击图片查看原图
点击图片查看原图
点击图片查看原图