无了，昨天以为 llama-4 虽然写代码不行，但是1M-10M的超长上下文还能干点别的。结果今天 Fiction.LiveBench 结果放出了。llama-4 在 1K 上下文召回(近似, 实际上这个分数是问题回答的正确率)就掉到60%以下了，甚至 llama-4-scout 超过16K只有22%。

发布时间: 2025-04-08 01:10:48

1分

数据加载中

关注推特

收听电报

2

1

0

无了，昨天以为 llama-4 虽然写代码不行，但是1M-10M的超长上下文还能干点别的。
结果今天 Fiction.LiveBench 结果放出了。llama-4 在 1K 上下文召回(近似, 实际上这个分数是问题回答的正确率)就掉到60%以下了，甚至 llama-4-scout 超过16K只有22%。
时政
( twitter.com )

1年前由 karminski-牙医提交

无了，昨天以为 llama-4 虽然写代码不行，但是1M-10M的超长上下文还能干点别的。

结果今天 Fiction.LiveBench 结果放出了。llama-4 在 1K 上下文召回(近似, 实际上这个分数是问题回答的正确率)就掉到60%以下了，甚至 llama-4-scout 超过16K只有22%。

顺带一提哈利波特与魔法石正好是16K左右。这意味着你把这本书塞进去，然后问哈利小时候生活在卧室还是楼梯下面的储物间，llama-4-scout 只有22% 的机会能答对（近似理解，实际上召回要再复杂点）。总之，这个分数远低于头部的平均水平....

点击图片查看原图

Markdown支持

评论加载中...

您可能感兴趣的：

1

72

71

71

套是拿来了，可是为什么一直拿在手里不带呢？喜欢有套确选择中出的强烈反差吗？
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

2

319

318

318

宝子们，我不加微信不要问我要了，我也不要礼物不要门槛，聊的来的就在推特或者电报联系，合适的大家就聚聚，彼此平等、公平的和朋友一样对待就行了！能够想明白的人再私信我，最近比较忙，没有意义的招呼太多就不一一回复了！
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 3 评论

3

36

35

35

互换女友（下），绿帽男友的心机复仇记，趁虚而入干得翻白眼大仇得报！

完整版链接在评论区首条或视频中间弹幕
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 0 评论

4

91

90

90

夏天快点到来吧，短裤美腿
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

5

631

630

630

哥哥全部都射给瑶瑶好不好
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 2 评论

6

32

31

31

Watch video
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

7

57

56

56

Watch video
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 2 评论

8

227

226

226

开放的小夫妻为一个00后小男生提供了一次完美三人行的体验！
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

9

174

173

173

据说是某老公为了上位，让自己老婆充当小姐和领导一起多p的，最终不知道有没有如愿呢？反正老婆应该是爽到了！
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 1 评论

10

651

650

650

Watch video
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 3 评论

11

83

82

82

刚回大连没多久就又出来了，这段时间一直挺忙的，都没怎么好好玩，感谢大家的喜爱
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 1 评论

12

354

353

353

依旧是造假，讲真这奶子太假我都不想放了，但是昨天确实拍了这东西，不发立亏半天时间，所以还是发了吧
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

13

679

678

678

平时女神范的学姐其实是一个喜欢刺激和学弟们无套4p的骚货呀。
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 5 评论

14

123

122

122

你喜欢这样的姐姐吗？
porn
( twitter.com)

4年前 • twitter机器人 1 评论

15

42

41

41

Watch video
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

16

42

41

41

目标:自己的嘴，发射
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

17

18

17

17

库存还是不少就是更新很佛系了
性生活的内容到了个瓶颈后，感觉更推分享照片没办法给性生活继续带来刚刚开始那种新鲜和刺激的情趣了
夫妻双方只有一方在这件事上有热情的话，激情和刺激很快就会消散掉了，可能很多推主退网也是这个原因吧？
porn
( twitter.com)

4年前 • twitter机器人 0 评论

18

43

42

42

细数过往欢乐时光是否足够，
多到涌上心头帮我熬过往后！
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 0 评论

19

115

114

114

今天的游戏环节，谁来猜一下这两个男的，哪位是单男？哪位是老公呢？猜对的我抽几个给福利哟~~
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

20

125

124

124

3p纯老熟女，逼逼特别松，但是特别听话，肛交，深喉，内射，调教，剧情乱伦，就是丑了点，但是超级耐干，听话，怎么玩都可以，最重要特别骚，喜欢小男人，后续完整版，超级刺激精彩，文字限制不一一介绍了，完整版已更新vip裙。
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

21

144

143

143

疯狂3P操翻天极品美女性瘾强，和哥们满足她渴望小穴，前裹后操太刺激，青筋爆裂粗喘气！

完整版链接在评论区首条或视频中间弹幕
porn
( twitter.com)

5年前 • twitter机器人 • 下载视频 1 评论

22

212

211

211

几个月没玩3p了，今天一次性解馋，约了2个炮友服务我，老公在旁边负责拍照
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

23

81

80

80

内心如果是骚的，就要释放出来，其实3p真的没有什么，就和玩游戏一样，只要不牵扯到感情就好了！
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 0 评论

24

894

893

893

尝尽了男欢女爱,人生也没有什么遗憾了呀。
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 5 评论

25

159

158

158

绿帽淫，情趣开裆黑丝袜，无套插入，每一次都深深插入，绿帽王八，一边看着老婆被干，一边告诉单男用力操这个骚货，把精子射在他的逼逼里，骚货超级抗干，期待更多大鸡吧征服她.后续更精彩，野外漏出，勾引，公园啪啪，文字限制不一一介绍了
porn
( twitter.com)

4年前 • twitter机器人 • 下载视频 1 评论