李飞飞:Emily,很好的问题。实际上,无论我是在 K-12 夏令营,还是在斯坦福大学的 AI 导论课程中,我的信息都是一样的,那就是要认识到这项技术,它是什么,以及如何负责任和审慎地使用它。理解并接纳它,因为它是一种横跨各个领域的技术,正在改变我们的文明,推动商品流通,科学发现的快速进展,寻找治疗癌症的方法,绘制生物多样性地图,和我们一起发现新材料。但同时,也要认识到所有可能产生的后果,包括可能的非预期后果,以及如何负责任地开发和部署它。我认为,在现今的对话中,保持平衡,理性深思的声音非常重要。无论是在白宫还是学校。
AI 模型的训练数据问题
Emily Chang: 现在,我不知道你会否称这为一场危机或一个转折点,但 AI 模型的训练数据正在耗尽,然后有些公司开始转向使用 AI 生成的数据和合成数据来训练他们的模型。这个问题有多严重?有哪些风险?下一步该怎么做?
李飞飞:首先,我认为 AI 模型的训练数据正在耗尽是一种非常狭隘的观点。我知道你在暗指那些消耗大量互联网数据的大语言模型,特别是那些来自网站、Reddit、维基百科等你能获取的数据。即使在谈论语言模型,我们也不应局限于此。我认为还有很多可以探索的。我们看到,不同的数据可以用来构建定制化的模型,无论是用于新闻业还是在诸如医疗保健等不同的行业领域。其实我们并没有耗尽数据。实际上,还有很多有许多行业还未进入数字化时代。我们并未充分利用数据,不论是在医疗、环保还是教育等领域。因此,即使在语言模型这个领域,我不认为我们的数据已经用尽。
关于 AI 生成数据的使用
Emily Chang: -您认为现在使用 AI 生成的数据来训练模型是好事,还是这可能会让我们逐渐远离原始数据,以一种可能危险的方式进行?
李飞飞:- 我们正在尝试,至少斯坦福人类中心 AI 研究所正在尝试。我认为很多人也在试图做这个。我经常被问到这个问题,Emily,你对 AI 还抱有希望吗?首先,这是一个非常悲伤的问题,但我确实会说,我的希望并不在 AI 上。我的希望在于人。我并不是一个妄想的乐观主义者。人是复杂的。我是复杂的。你是复杂的。但我的希望在于人,在我们的集体意愿,在我们的集体责任,很多事情正在发生,我们正在前进,我们中的许多人正在努力使这项技术成为一项可靠的文明技术,以便提升我们所有人。
李飞飞:- 我无意中挥了挥手。我不认为我们给了足够的声音给那些真正以最具想象力、创造性的方式试图用 AI 给世界带来好处的人。
对过度管制的担忧
Emily Chang: - 有没有任何人,任何事情你想指出就是任何人或任何公司,让你感到恼火?
李飞飞:- 我知道你在说什么。我已经指出过他们,我不会说是胡说,只是我觉得我们对“存在危机”关注得太过了,哦,不对,是“灭绝性的危机”。- 存在主义引发的灭绝危机。- 是的,就是这个意思。这就是我们过于强调的问题。我担心我们国家不同地区,比如加利福尼亚,正在推进的一些法案,过于强调这个问题。这些法案可能出于善意,但它们对 AI 模型设定了限制,甚至可能无意中将开源视为违法,而没有真正思考如何评估和审查这些 AI 模型。我对此感到担忧。