site stats
就在刚刚 OpenAI 发布了两个开放权重模型! 给大家带来深度解析!gpt-oss-120b 激活参数量 5.1Bgpt-oss-20b 激活参数量 3.6B两个都是 MoE 架构的推理模型.首先, 这两个模型发布的就已经是量化版本了, 他们的 MoE 层直接用 MXFP4 精度训练的! 这意味着暂时没有办法微调这两个模型了
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多