来啦！GPT-4.1 测评！KCORES 大模型竞技场为大家带来 GPT-4.1 测评！直接说结论：Gemini-2.5-Pro 仍然领先榜首GPT-4.1 大概与 Qwen-2.5-Max 相当, 甚至在我的测试集里面是不如 OpenAI-O3-mini-high 和 OpenAI-o1 的GPT-4.1-mini 则与老的 DeepSeek-V3 差不多, 或者说, 是一个价格便宜的 GPT-4.5

发布时间: 2025-04-15 09:11:11

1分

数据加载中

关注推特

收听电报

2

1

0

来啦！GPT-4.1 测评！
KCORES 大模型竞技场为大家带来 GPT-4.1 测评！直接说结论：
Gemini-2.5-Pro 仍然领先榜首
GPT-4.1 大概与 Qwen-2.5-Max 相当, 甚至在我的测试集里面是不如 OpenAI-O3-mini-high 和 OpenAI-o1 的
GPT-4.1-mini 则与老的 DeepSeek-V3 差不多, 或者说, 是一个价格便宜的 GPT-4.5
时政
( twitter.com )

1年前由 karminski-牙医提交

来啦！GPT-4.1 测评！

KCORES 大模型竞技场为大家带来 GPT-4.1 测评！直接说结论：

Gemini-2.5-Pro 仍然领先榜首
GPT-4.1 大概与 Qwen-2.5-Max 相当, 甚至在我的测试集里面是不如 OpenAI-O3-mini-high 和 OpenAI-o1 的
GPT-4.1-mini 则与老的 DeepSeek-V3 差不多, 或者说, 是一个价格便宜的 GPT-4.5
至于 GPT-4.1-nano, 甚至打不过文心一言, 就....别用了吧

分项成绩：
20小球物理模拟测试
GPT-4.1 代码运行的质量是不错的, 但是问题是, 小球的摩擦并没有带来小球的旋转,
GPT-4.1-mini 也是同样问题
而 GPT-4.1-nano 则是只剩一个小球

mandelbrot-set-meet-libai 测试
GPT-4.1 的结果主要问题是颜色弄反了, 以及图形渲染的有点大
GPT-4.1-mini 则因为没有全屏渲染扣了分数
GPT-4.1-nano 则指令遵循都有一些问题了, 包括内部全都填充了文本, 中心不正确, 性能太低等等

火星任务测试,
这个就惨不忍睹了, GPT-4.1 渲染的轨道和飞行器执行窗口完全不正确
GPT-4.1-mini 则连星球和飞船都没有
至于 GPT-4.1-nano, 抱歉, 生成的代码跑不起来, 报错了

太阳系模拟测试,
这个也很完蛋, GPT-4.1 把水星与太阳重叠了.
而 GPT-4.1-mini 得分反而比较高, 没有什么太大的失误.
GPT-4.1-nano, 它.... 只画了几个圆圈就交卷了.

天梯地址：https://t.co/uUHyWq1J6c

#大模型竞技场

点击图片查看原图

点击图片查看原图

点击图片查看原图

点击图片查看原图

Markdown支持

评论加载中...

您可能感兴趣的：

1

832

831

831

今年看到最好的医疗剧，医技太好了，希望自己也能参演！
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 2 评论

2

259

258

258

这姐姐太6了，伤害不大，侮辱性极强啊！
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 1 评论

3

58

57

57

(橘娘作品)
这才叫玩弄每天都要玩一玩
玩够了才让这根棒棒来
土豆小群
porn
( ptcc.in)

5年前 • twitter机器人 • 下载视频 0 评论

4

224

223

223

开放的小夫妻为一个00后小男生提供了一次完美三人行的体验！
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

5

84

83

83

夏天快点到来吧，短裤美腿
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

6

912

911

911

Watch video
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 1 评论

7

542

541

541

Watch video
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 3 评论

8

128

127

127

家里的DLS用完了，有没有送货上门的呢？
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

9

109

108

108

好久没发视频了
发一个存货⑧
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

10

523

522

522

有阿朱的脑残粉们
私信喷我
说阿朱不是快餐妹
这是她男朋友
这智商是怎么知道推特的
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 3 评论

11

237

236

236

Watch video
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 3 评论

12

209

208

208

骚逼老婆一大早就打扮的很性感去约炮了，越来越会享受了
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

13

902

901

901

老公既然同意了,那享受就完了。
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 3 评论

14

416

415

415

多么单纯天真的小脸蛋被几个上年纪的老男人操的四射喷水没想到单纯的外表内还藏着多么骚的一个灵魂
完整版点击下方链接观看
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 1 评论

15

134

133

133

如何在2022第一时间搞个大动作
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

16

165

164

164

最近作息时间调整了一下。今天改成上午发。
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 1 评论

17

78

77

77

也不知道什么时候能够实现自身水循环自给自足
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 1 评论

18

29

28

28

互换女友（下），绿帽男友的心机复仇记，趁虚而入干得翻白眼大仇得报！

完整版链接在评论区首条或视频中间弹幕
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 0 评论

19

232

231

231

人妻女神阿崩的群交聚会，1vs4小逼都累坏了，还要被快进处理，太过分

完整版链接在评论区首条或视频中间弹幕
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 0 评论

20

149

148

148

后来
有些人一旦错过就不在！
谁有好的玩法？欢迎留言建议
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 1 评论

21

218

217

217

这一个个的笑死人了。一个拍奶子,后面的都跟着学。
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 1 评论

22

545

544

544

Watch video
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 1 评论

23

24

23

23

Watch video
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

24

75

74

74

(橘娘自拍)
一夜没休息差点把我cao废了
战况可想而知
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 1 评论

25

78

77

77

【橘娘作品】
原视频超清肉丝之美淡黄色袜子
小号@GNB520
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论