site stats
今天有跟Nvidia 研发中心的一位技术负责人聊,他们这有六十多块A100。之前帮一团队训练模型,用8块A100训练,训练效率大概每秒10w Token。无锡超算那边基本上大部分都是国产化设备,训练模型的效率大概是每秒9w Token。在模型训练上,仅用8块A100就能抵过一个超算中心了。
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多