2025-03-27

先斩意中人

 


昨晚 GPT-4o 推出了​最新的图片编辑功能,互联网上顿时哀嚎一片。

我去看了一下,效果的确拔群。比如说那张著名的双雄战斯基的新闻照片,只需要输入一句话,让GPT-4o 把图片改为吉卜力工作室绘画风格,​AI 就可以从图片的最底层开始理解,然后转换风格重新绘制:





(下图来自:@passluo@x.com)

当然,不止是吉卜力风格,你要《南方公园》风格也没问题,而且看起来表现力还要更好一些,这时候你甚至能觉察到吉卜力风格在美化和柔化现实世界,而​《南方公园》其实是那么的生猛有力:



​想要芝麻街风格也没问题:


所有这一切,只是对 AI 输入一句话的事:请把图片吉卜力/南方公园/芝麻街风格化。结束,句号。

为什么网上一片哀嚎?因为大模型的一次升级,就会​最先灭掉紧紧跟随自己的创新者,创业者。你想一下,原先你拿一张自己的大头照,在网上找人帮你变成卡通风格的头像,是不是得交个 5​ 块钱?对方懂 AI,知道如何建立一个工作流,知道如何微调图片,生成你想要的大头照,这是不是值得​ 5 块钱?那么,​现在大模型可以让人直接用一句话就完成这件事,那么这项微小创新,微小生意是不是就遭遇了灭顶之灾?

这件事情的讽刺之处就在于,AI 现在并没有消灭掉所有拿铅笔给人画素描肖像的画家,但是,它却先消灭了紧紧跟随自己,拥抱自己,甚至是深深信仰自己的那些人。网络上有一句流行语​:「上岸第一剑,先斩意中人​」,用来形容这种情况再合适不过。

用我经历过的历次互联网创新浪潮和这一次的 AI 浪潮相比,我感觉​AI 浪潮有很大的不同。以前通常可以使用的跟随策略+微小创新,在这一轮里​好像不是那么好用了。新技术出现,新思路出现,总有挂一漏万的可能,并不能立即解决所有用户​需求,所以人们可以利用新技术、新思路去做各自的应用,​服务于人群。

比如都是信息推送技术,​你可以拿去做推送邮件的服务,你也可以拿去做推送对话消息的即时通讯服务。比如都是照片瀑布流,你可以拿去做​图片社交,你同样可以拿去做生活经验分享。没有一家可以同时把这些事情全都做了,于是每个人都可以来点微创新,微创造,共同打造一个​巨大的新生态。

但那是过去,新​技术,新思路都是静态的,都是非智能的。AI 不是,它每天都在进步和进化,它本身现在​越来越能思考,越来越像一个人。原先的创新方式遇见AI,​逻辑上就不再成立:你没有办法做一个 AI 暂时想不到,​AI 暂时不想做的功能。AI 会想到的,​AI 也都会做到的。

刚刚发生的事情,​就是 AI 发生了进化。大家原先把它当作一个单一的画图工具,​如何思考,如何调整,这一部分工作还是人类自身的,AI 只是根据指令去画而已。现在 AI 升级了,扔一张图片给 AI,AI 能够「理解」画面的内容,背后想要表达的​意图。于是,它不再是一个工具,而是像一个真人助手,他理解你的​指令,他也理解自己的工作内容,最后你就像是嘱咐人一样,说一句:请把图片吉卜力/南方公园/芝麻街风格化​---然后它就做好了。

​这里出现了以前早就有的2件事:1、AI 理解了图片的本意。2、AI 理解了各种风格的含义。但是,还有第 3 件事是以前不曾发生的:​3、AI 利用新风格去表现图片的本意,保留所有重要元素和线索---这原本是人才能做到的事情。这三点结合起来,​AI 一剑斩杀了意中人。

所以,我认为 AI 出现的意义并不局限于让人们得到一种更为方便高效的新工具,而是在于它的强大迫使人们不得不​去升级自己的思考方式。否则,今天GPT-4o 可以毁灭一批微小创新者,明天新的 AI 大模型​可能会毁掉一批新创公司,一次升级就可以让他们原先的所有业务模式归零。

这一次跟太近,跟太近怕是会出事,这一次创新太微小,太短程,怕也会出事。简单说,AI 有智慧,或者说正在变得有智慧起来,创新者和 AI 比拼脑力,在算力上,在进化速度上来看,我认为​不是一种明智的做法。以前那种稍微想一下,想多一点,想深一层,你就可以创新创业的时代过去了,因为 AI 很快就能赶上来,它知道的比你多,想得比你快,想得比你多,想得比你深,但是出手却比你​快比你重。

怎么可能用自己的聪明去为一个极度聪明的人开路呢?​他不需要啊。怎么可能认为这样​靠聪明开出来的路是自己的呢?他不认同啊,他全要啊,他有这个能力​。所以,这是思维上的误区,​是时候换个不同的想法了。

最后,再贴一些著名场面​给大家观赏:



------














没有评论:

发表评论

近期热门博文