site stats
近日,DeepMind与哈佛大学新研究证明了大脑中存在“分布强化学习”,而大脑中的强化学习是通过“快乐之源”多巴胺驱动。和AI系统类似,大脑不是以“平均值”的方式预期未来可能的回报,而是以“概率分布”的方式来预期。
发布时间:
5
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多