nano-banana的更新,是一个AI创新的历史性节点。
这个模型揭开了一块AI行业的一块遮羞布。
所有能打的AI绘画模型,不是产品的原因,
仅仅是因为不懂业务,只看需求!
他们认为,客户的需求很重要,
于是追求完成这个需求。
但是完成这个需求,需要扎实的业务功底。
和一个巨长的业务执行流程,整个路径非常复杂。
相当于让一个种地的老汉,去米其林后厨做一份牛排。
大厂同行:都在追求炫酷的简单输入,炫技输出。
领导很兴奋,员工跑断腿,效果打折,周期创作周期巨长。实际在业务上,能解决的问题非常有限,业务识别空缺,导致模型产品化路径的曲折。
总是研究的放后面,能引发话题的放前面。
废了一百年的努力,做出来一个半吊子东西。
结果:小白骂娘,从业者骂娘,营销号捧上天,消费者寥寥无几。
小厂同行:技术实力不足,资源不足,使了大劲满足一点点需求,还需要强大的知识探索欲,技术实践成本高,花几个月时间,巨大资金成本解决一个小问题。有一部分使用基础,熊瞎子劈苞米,消费者丢一群再拉一群。迭代根本没法持续覆盖。
结果:学会的用烦了,没学会的又很难学会。
开源同行:应用做了七七八八,精神世界满足开花,加起来服务没几十万人,全都是赚到钱没给开源创作者花。模型迭代一次,坟头高一尺,没准哪个模型出来,过去的技术根本没有迭代的必要。
结果:有道义的同行人,纷纷跳坑,只剩下几个孤儿。
懂业务,是做AI的前提。
我很早就说过,2023年我之所以用AI绘画,
是因为我要画分镜,我们花了大量的努力,
在2024年初就实现了和名人合影,训练一致性模型。
很多现在简单的功能在一年多前都可以实现,
不懂业务的人,连看都看不懂。
今天nano-banana每一个功能都是直切业务核心点的。
他不是单纯的一个模型技术的更新。
论修改,其实有很多了,方法也有很多。
但是这个模型,一次性把所有的业务关窍打通了。
其实sora已经很厉害,
但是sora对业务的覆盖没那么全面。
几个月前,很多谷子店类的供应商,
都开始用sora做业务内容了。
但限制很多,可是从我们对模型理解来说,
开源模型是技术瓶颈,
但是对于sora这些模型,有些业务细分,
不应该是这个模型的瓶颈。
举个简单的例子,让柯南从空手到拿一枝花没有问题。
但是你让一个手办,手上多一个东西却非常难。
从业务的角度讲,这件事其实一点不难。
可sora就是不给你优化,
是技术不到位吗?MJ那么简单的操作,实现不了吗?
完全就是对业务理解的偏差。
那么我们再举一个MJ的例子,
这个模型的审美水平强不强?
说实话,一年以前,
我们就可以用这个模型来实现多视角服装模特了。
还有仿真人的虚拟真人角色创建。
但是技术实现上非常讨巧,
至今可能没人能做到,
我们也不愿意把这些东西传播出去。
但大多数人的视野里,是看不到MJ模型本身的能力的。
MJ公司追求的什么我也不知道,
就知道他们在不断的做,跟业务贴边的东西,
就是不好好优化,导致这个模型的二次修正特别多。
我再说一遍,上面两个问题,不是模型能力不行,
就是公司对各行各业需求的业务不理解。
谷歌证明给你们看了,谁也不需要反驳,
站着挨打就完事了。