槽边往事: 先斩意中人

昨晚 GPT-4o 推出了最新的图片编辑功能，互联网上顿时哀嚎一片。

我去看了一下，效果的确拔群。比如说那张著名的双雄战斯基的新闻照片，只需要输入一句话，让GPT-4o 把图片改为吉卜力工作室绘画风格，AI 就可以从图片的最底层开始理解，然后转换风格重新绘制：

（下图来自：@passluo@x.com)

当然，不止是吉卜力风格，你要《南方公园》风格也没问题，而且看起来表现力还要更好一些，这时候你甚至能觉察到吉卜力风格在美化和柔化现实世界，而《南方公园》其实是那么的生猛有力：

想要芝麻街风格也没问题：

所有这一切，只是对 AI 输入一句话的事：请把图片吉卜力/南方公园/芝麻街风格化。结束，句号。

为什么网上一片哀嚎？因为大模型的一次升级，就会最先灭掉紧紧跟随自己的创新者，创业者。你想一下，原先你拿一张自己的大头照，在网上找人帮你变成卡通风格的头像，是不是得交个 5 块钱？对方懂 AI，知道如何建立一个工作流，知道如何微调图片，生成你想要的大头照，这是不是值得 5 块钱？那么，现在大模型可以让人直接用一句话就完成这件事，那么这项微小创新，微小生意是不是就遭遇了灭顶之灾？

这件事情的讽刺之处就在于，AI 现在并没有消灭掉所有拿铅笔给人画素描肖像的画家，但是，它却先消灭了紧紧跟随自己，拥抱自己，甚至是深深信仰自己的那些人。网络上有一句流行语：「上岸第一剑，先斩意中人」，用来形容这种情况再合适不过。

用我经历过的历次互联网创新浪潮和这一次的 AI 浪潮相比，我感觉AI 浪潮有很大的不同。以前通常可以使用的跟随策略+微小创新，在这一轮里好像不是那么好用了。新技术出现，新思路出现，总有挂一漏万的可能，并不能立即解决所有用户需求，所以人们可以利用新技术、新思路去做各自的应用，服务于人群。

比如都是信息推送技术，你可以拿去做推送邮件的服务，你也可以拿去做推送对话消息的即时通讯服务。比如都是照片瀑布流，你可以拿去做图片社交，你同样可以拿去做生活经验分享。没有一家可以同时把这些事情全都做了，于是每个人都可以来点微创新，微创造，共同打造一个巨大的新生态。

但那是过去，新技术，新思路都是静态的，都是非智能的。AI 不是，它每天都在进步和进化，它本身现在越来越能思考，越来越像一个人。原先的创新方式遇见AI，逻辑上就不再成立：你没有办法做一个 AI 暂时想不到，AI 暂时不想做的功能。AI 会想到的，AI 也都会做到的。

刚刚发生的事情，就是 AI 发生了进化。大家原先把它当作一个单一的画图工具，如何思考，如何调整，这一部分工作还是人类自身的，AI 只是根据指令去画而已。现在 AI 升级了，扔一张图片给 AI，AI 能够「理解」画面的内容，背后想要表达的意图。于是，它不再是一个工具，而是像一个真人助手，他理解你的指令，他也理解自己的工作内容，最后你就像是嘱咐人一样，说一句：请把图片吉卜力/南方公园/芝麻街风格化---然后它就做好了。

这里出现了以前早就有的2件事：1、AI 理解了图片的本意。2、AI 理解了各种风格的含义。但是，还有第 3 件事是以前不曾发生的：3、AI 利用新风格去表现图片的本意，保留所有重要元素和线索---这原本是人才能做到的事情。这三点结合起来，AI 一剑斩杀了意中人。

所以，我认为 AI 出现的意义并不局限于让人们得到一种更为方便高效的新工具，而是在于它的强大迫使人们不得不去升级自己的思考方式。否则，今天GPT-4o 可以毁灭一批微小创新者，明天新的 AI 大模型可能会毁掉一批新创公司，一次升级就可以让他们原先的所有业务模式归零。

这一次跟太近，跟太近怕是会出事，这一次创新太微小，太短程，怕也会出事。简单说，AI 有智慧，或者说正在变得有智慧起来，创新者和 AI 比拼脑力，在算力上，在进化速度上来看，我认为不是一种明智的做法。以前那种稍微想一下，想多一点，想深一层，你就可以创新创业的时代过去了，因为 AI 很快就能赶上来，它知道的比你多，想得比你快，想得比你多，想得比你深，但是出手却比你快比你重。

怎么可能用自己的聪明去为一个极度聪明的人开路呢？他不需要啊。怎么可能认为这样靠聪明开出来的路是自己的呢？他不认同啊，他全要啊，他有这个能力。所以，这是思维上的误区，是时候换个不同的想法了。

最后，再贴一些著名场面给大家观赏：