site stats
可验证意味着基本上就可以转化为封闭式问题封闭式可验证问题的任何benchmark早晚都会被攻克,这个没啥疑问但太多开放性问题无法用自动化/AI转换成封闭化/可验证问题,这不是暂时的,会是很长很长时间无法解决的瓶颈而“判断”(我更倾向于evaluation这个词)这件事情本身,就是一个开放性问题
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多