政协委员,央视副召集人张勤提案大模型训练: 如果我们训练的大模型持续用西方价值观数据、西方应用场景来训练中国大模型,中国式的认知将被湮没。
张勤委员在提案中指出,文生视频,关键在文,对于人工智能而言,输出什么关键还是看输入了什么。但是目前,对于国内外大模型而言,对中国优秀传统文化的学习还是严重不足。当前全球通用(国内也在使用)的大模型数据训练集里,中文语料仅占1.3%,中国企业使用的语料中,由美西方主导的英文语料占绝大多数,如果我们训练的大模型持续用西方价值观数据、西方应用场景来训练中国大模型,中国式的认知将被湮没。
以OpenAI的ChatGPT为例,它对于中国文化的理解非常有限。比如,让它列出著名的七绝,它给出的回答里却有杜甫的《春望》、王之涣的《登鹳雀楼》等五言绝句。在全球新的技术变革中,如果不加以引导,中华优秀传统文化容易被人工智能抛下甚至抹去。
https://t.co/xQz1uYkbVI
点击图片查看原图