site stats
DeepSeek V3 预览版低调发布,但是非常牛逼。一句话重点:编程能力超过 Claude Sonnet 3.5。这还只是预览版。测试的基准是 Aider 的多语言基准,一个用于衡量模型编程能力的基准,具体介绍放在图2,官网放到回复里了。几个模型的得分- 62% o1- 48% DeepSeek V3 预览- 45% Claude- 38%
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多