使用下面的搜索规则,更精确:
例如: site:news.163.com author:老司机 saved:搜索自己收藏的内容
site:news.163.com author:老司机 saved:搜索自己收藏的内容
默认搜索标题...
感谢多伦多方脸的翻译,这篇文章对DeepSeek的技术和成本解释的很清楚。 关于MLA,MoE的部分,我们在上周日(7天前)就给出了和这篇报道几乎完全一样的解读, 唯一的不同的地方MTP,在n=1下,对效率影响真的不大,可见本文编辑也不完全是业内人士 为什么我们能提前一整周对DeepSeek技术细节做出精准判断? 其实我只是做了99%的大V都不会做的事: 把原文paper读了一读。。。 🤣🤣🤣🤣
只需要几秒!
创建帐户
已拥有账号并想要登录?
登陆 忘记密码?