开放的迷途,与关起门来的神祇
—— 开源的中国 vs 闭源的美国
有些事,总在脑子里盘旋。
就说去年夏天吧,Meta 把 Llama 2 开源协议扔进场子,像一声枪响。Hugging Face 那边,光是中国 IP 的下载量,几周就冲破了 15 万。 一夜之间,百川、智谱、通义千问……几十个名字挤上牌桌,参数大大小小,闹哄哄的,你方唱罢我登场。 可地球另一头,那个名字里还带着“Open”的某实验室,却悄悄地把门关得更紧了。
这到底是分道扬镳,还是一场更大棋局的开场?
有个说法,我一直觉得很有意思:当技术逼近那个看不见的临界点,它的创造者,往往会先背叛自己。
你看美国。这个曾用 GNU、Apache、Git 这些东西给整个互联网文明打下地基的国家,如今在 AI 这个最前沿的阵地,守门的却换成了一水的律师和投资人。OpenAI,这名字本身就是一份写给全人类的承诺书,现在呢?成了一座最坚固的堡垒。它的 API 像一条极细的管子,你是可以付费取水,但休想看一眼水源地的模样。
讽刺的是,大洋彼岸的中国,反倒在“开源”这条路上跑出了加速度。
但我并不觉得,这是一种多么纯粹、多么理想主义的选择。
说真的,这更像一种……嗯,一种落后半个身位时的必要姿态。人家已经建好了宏伟的罗马万神殿,你再去一砖一瓦地模仿,太慢了。最快的办法,就是把不知从哪儿泄出来的建筑图纸贴满大街,发动一场“人民战争”,让成千上万的工匠、泥瓦匠,甚至纯粹的好事者,都跑来掺和一脚,在自家后院里叮叮当当地敲。
这里头,有喧哗,有泡沫,但也有那股最原始的、烫手的活力。
我想起去年,跟一个刚从大厂“毕业”出来创业的朋友聊天。他眉飞色舞地给我看他捣鼓出来的客服机器人,就是用开源模型微调的,前后两周,成本不到五万块。他拍着桌子说:“GPT-4 好是好,可太贵了,我的数据也不敢传给它。现在这个,是丑,可它是我的。”
我看见他眼睛里有光。
那种光,一半是创造的喜悦,另一半,是被“赋权”的激动。
就是这种“赋权感”,正在催生一个庞大到有些混乱的市场。法律咨询、情感陪伴、营销文案、代码生成……数不清的中小企业和独行侠,正靠着开源模型的力量,用极低的成本往自家产品里塞进 AI。他们绕开了 OpenAI 那道昂贵的窄门,也摆脱了对单一巨头的依赖。于是,一个去中心化的、毛细血管似的创新网络,就这么野蛮地长了出来。
可风险,也埋在这片繁荣底下。这种模式太容易导致“重复造轮子”和低水平的价格战了。当所有人都趴在 Llama 或 Qwen 的地基上修修补补时,谁去想下一代架构的事?这种所谓的“开放”,会不会最终,只是变成了一种更巧妙、更难察觉的技术依附?
不止一位在硅谷的朋友跟我说过:真正的基础模型研究,是只有国家队和顶级财团才能上桌的豪赌。那需要几万块 A100 芯片烧上几个月,需要几百个顶尖的脑袋凑在一起。这早就不是一个“社区”或“集市”能扛得住的了。在他们看来,OpenAI 的“封闭”是必然。为了保护天价的投入,也为了在通往 AGI 的路上,能绝对纯粹、高效地执行。
从某种意义上说,他们是对的。
一个封闭的系统,确实能最大限度地集中资源,去办那些最难的事。
然而,牌桌上空,总有政策和地缘政治的幽灵在盘旋。美国对华的高性能芯片禁运,像一只看不见的手,死死扼住了咽喉。这让“集中力量办大事”的叙事,一下子听着有些苍白。所以,中国这边的开源选择,就又多了几分对冲风险的现实意味:用模型的“量”来补芯片的“质”,用生态的广度,去换取在窄路相逢时的腾挪空间。
上海人工智能实验室他们搞的“书生·浦语”(InternLM),就是这么个例子。它不光开源模型,还想把数据、预训练、微调、评估这一整条链都给开源了。这背后的心思其实更深:就算我们暂时造不出最锋利的矛,那也得先建一个最繁荣的兵工厂,让每个人都能拿起武器。
这或许生不出一个能跟 GPT-5 正面对抗的“大神”。
但它能确保这片土地上,永远有无数个持械的、不肯认输的战士。
当然,会有人说,这不过是在建一个“局域网”式的技术孤岛。
但有时,孤岛也是一种避难所。
于是,我眼前就浮现出这么一幅奇特的双螺旋图像。美国,正沿着一条精英主义的路线向上爬,想靠少数天才的智慧,为全人类——或者说,为它的付费用户——定义未来。而中国,在一种实用主义的驱动下,向下扎根,想用群体智慧的广度,去试探所有可能的应用场景。
一条路,通往神坛;另一条路,通往田野。
前者关起门来,创造神祇;后者敞开大门,迎接信徒。
谁能走到最后?我不知道。
因为历史已经无数次证明,最坚固的堡垒,有时会从内部腐烂。而最混乱的集市,也可能在某个角落里,诞生出颠覆性的火种。
我们啊,就站在这岔路口,看着两条路在在迷雾中延伸,越走越远,再没有交集。
火种已经撒下去了,可风,会往哪边吹呢?