site stats
如果只是因为FP8 的格式不同牺牲精度换取动态范围训练的话deepseek所谓的优势其实根本不复存在唯一的优势,只是能让国产大模型“在没有英伟达芯片的前提下”不会死的太惨但即便有最强芯片,其模型的水平也到不了世界前三更别提AGI了这点可以参考美国模型发布的竞争情况
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多