site stats
LLM 通常使用 16 位浮点参数 (即 FP16 或 BF16) 进行训练。因此,存储一个权重值或激活值需要 2 个字节的内存。如果参数能从16位降低到8位或者4位,就能对模型大小进行压缩,而不会降低模型精度。前些天的一篇论…
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多