site stats
OpenAI 12 天 的 第 2 天,强化微调,通过少量数据,让模型在专业领域到达专家水平。跟之前的微调不一样,它不是通过把数据记住答案,而是在微调的过程中训练自己在某个领域的推理能力找到正确答案,有点像给 AI 一本棋谱,让它自己训练自己下棋。
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多