site stats
今天有跟Nvidia 研发中心的一位技术负责人聊,他们这有六十多块A100。之前帮一团队训练模型,用8块A100训练,训练效率大概每秒10w Token。无锡超算那边基本上大部分都是国产化设备,训练模型的效率大概是每秒9w Token。在模型训练上,仅用8块A100就能抵过一个超算中心了。
sign_in_with_google

59669 位用户此时在线

24小时点击排行 Top 10:
  1. 本站自动实时分享网络热点
  2. 24小时实时更新
  3. 所有言论不代表本站态度
  4. 欢迎对信息踊跃评论评分
  5. 评分越高,信息越新,排列越靠前