槽边往事: Midjourney

显示标签为“Midjourney”的博文。显示所有博文

2023-06-15

孙悟空大战奥特曼

昨天我收到一条留言，来自一位名叫王珂Vanchael 的教师，他说：

“我在村里教书，今天给学生们展示了一下midjourney的效果。他们很惊讶，就想让我画奥特曼。我大手一挥，豪气地说：那就画个奥特曼和孙悟空踢足球吧。我还特地用ChatGPT帮忙翻译了一下。结果，玩砸了，画面没有奥特曼，也没孙悟空，只是一只类猴子生物在踢球。孩子们很给面子，没嘘我，但我还是不好意思。能画出自己想画的，还是太难。”

这条留言出现在文章《不期而遇的黑T恤》后面，它让我相信王老师是一位很好的人民教师。一方面是因为他愿意想办法帮助孩子们开拓眼界，让他们和这个世界同步，同时也在试图激发孩子们宝贵的想象力。

另外一方面是因为他的情商很高，我写的那篇关于黑 T 恤的文章，主要内容是讲我无法找到一件我心仪的 T 恤。留言区里就有许多读者建议我先用 AI 画出来，然后再用图片搜索去找。王老师写了那么一段个人经历，最后落脚在“能画出自己想画的，还是太难”这句话上，我认为他的情商最起码有 185，对于孩子们而言是一件极为幸运的事。

所以王老师也不用太失望，从昨天看到您的留言之后，我就做了一些尝试。接下来的这批图片您可以拿去给同学们看看，还有一些话也请一并帮我带给他们：

奥特曼和孙悟空踢足球，这个场景的确很难用 AI 画出来。原因是人的想象力要比 AI 强，你现在想象一个金盔金甲的孙大圣很简单，再想象一个穿红色紧身衣戴面罩的奥特曼，也很简单。然后，你就可以想象他们两个在绿色的球场上你来我往踢足球。

AI 不是这样。AI 要看一遍所有关于奥特曼的电影电视剧，这样它才能学会所有奥特曼的特征，学会画出一个奥特曼来。而且不止如此，AI 还学习了整个奥特曼的世界，那里的建筑，那里的怪物，那里的景色，一整套，全都学下来。

对于孙悟空也是一样，AI 不单学习了孙悟空的金箍棒，他的盔甲，他的虎皮裙，还得一并学习那个神仙世界，凌霄殿、广寒宫、蟠桃园、盘丝洞等等等等，也是一整套全都学了下来。

问题是，对于 AI 而言，这两个世界是不相容的。你要以孙悟空为主，那么孙悟空世界里出现一个奥特曼，这个奥特曼就得穿中式盔甲，或者中式长衫，手持拂尘、宝塔、照妖镜一类的法器。你要以奥特曼为主，那么孙悟空也得穿上机甲，要么就是一个赤身露体的多毛猴子，这就是奥特曼世界里常见的事。同时让他们俩各自保持自己的风格，然后在同一个场景里出现，AI 很难直接画出这样的景象，需要大量额外的工作。

所以我算了一下：孙悟空和奥特曼踢足球，在孙悟空的西游记世界里不存在足球这件事，所以只能请孙大圣前往奥特曼的世界，这样足球才踢得起来。那么，孙大圣就不大可能保持《西游记》里的造型，会变成下面这个样子：

虽然形象上发生了一点改变，但是风格上孙悟空和奥特曼就得到了统一。这同时也解决了一个很让人头痛的问题：怎么踢？按照西游世界的设定，孙悟空会七十二变，手里有极为沉重的金箍棒。他变成万丈高的巨人，一脚就可以把奥特曼连人带球踢出地球，这还怎么踢？按照奥特曼的设定，奥特曼要痛打小怪兽，小怪兽现在可以七十二变，金刚不坏，你让奥特曼怎么打？

所以，最后双方只能变成穿奇特服装的足球运动员，只能使用足球运动员的体能和技术，大家才能把球踢下去。但他们又不能是足球运动员，所以只能用服装，用姿态，把他们和凡人区分开来。那么，他们在绿茵场上就不能飞天遁地，只能这样：

主要是展示身材，展示盔甲，展示姿态，踢不踢球没那么重要。当然，之前说了要踢足球，那么也可以这么来一下：

是的，不大像人类的足球赛，倒是更像两个机械人在肉搏。但我觉得没多大关系，因为谁也没有见过孙悟空和奥特曼踢足球，这也许画的就是他们的第一场球。

然后踢球的重点也不在球，而在于球员的身姿，只要姿势帅就好。反正我们也无法想象出 90 分钟的比赛，能够想象的也就是传球、铲球、拦截这样的具体动作：

当然，你看到这里也许会说：这不是孙悟空，也不是奥特曼，根本就不像嘛。当然不像，从第一张图开始就不像。但是我一开始说，这就是孙悟空，然后你就可以在图片里分辨出谁是孙悟空，谁是奥特曼。为什么？因为你的想象力在发挥作用，就像是天空中的云彩，只要谁指着其中的一团说：看！那是一只小狗！然后大家就可以从各种平平无奇的云团里看出各种各样的东西，那就是想象力在发挥作用。

今天 AI 可以画一些从未出现过的画面，实现一些漂亮的效果，不过和人类的想象力相比，AI 还是相形见拙。就像是现在，凭借着几张画，你已经可以放飞想象，去幻想一场孙悟空和奥特曼的足球赛会是怎样的，而在你的想象中，要比我这些图片更合理，更具体，也更精彩。我打赌你现在肯定已经想到了一件事：场上的孙悟空用汗毛变成一整支足球队，每个队员都长得一模一样，让奥特曼很是觉得头晕。

人类所能做的事情还不止于此。比如说一个人使用 AI 工具画图，觉得自己画得不好，可以去找一个千里万里之外的陌生人---大家甚至相互根本不认识，但是对方就有可能试着帮忙画上几张。这种事情，AI 可做不到。

而一个人在网上找到另外一个陌生人，只是讲述了一下自己的故事，甚至都没有开口要求帮助，对方就愿意主动帮忙，因为被文字的内容和蕴含的情感所打动。这种事情，不单 AI 做不到，很多人也根本做不到。

所以，各位同学，你们很幸运能够拥有这样一位老师。他为你们展示了未来，展示了互联网的力量，也展示了人和人之间奇妙的联系。我认为，他给你们上了很精彩的一课，我作为这一课的教具，深感荣幸。我希望你们能喜欢这些 AI 绘画作品，我也更期待你们能够接触和学习 AI ，做一些比绘画更有趣更复杂的事情。

最后，王老师您并没有玩砸，您为学生上了一堂很好的课。谢谢您。

和菜头上

2023 年 6 月 15 日

于北京

又及：王老师，您不会是在分众美丽小学吧？谢谢你那么用心关照我家乡的孩子们。

---

2023-05-17

抱怨前想想自己的年纪

网上每天都能看到抱怨，但我认为那是年轻人的特权，不大适合中老年人。今天我看到一个中年男子，在网上抱怨AI 绘画工具Midjourney 难用。这让我一下子来了兴趣，因为我已经用了很长一段时间，感觉相当不错。

他抱怨的理由是Midjourney 没有提供一个他熟悉的工作界面，而是要让他去另外一个叫做Discord 的聊天软件，在软件的聊天频道里生成图片。看到他的理由，我觉得在检讨Midjourney 的得失之前，他应该先去检查一下自己身份证上的出生年月。

几周前，中文互联网上有一批流行帖子在介绍Midjourney ，传播的核心点是“11个人的小团队支撑起AI 绘画方向的巨头公司”。这是个事实，Midjourney 团队没几个人，但是拥有上千万用户，创造了上亿美金的营收，比当年的Instagram 还要厉害。不过，在这些介绍Midjourney 的帖子里，却极少提到他们使用Discord 来运营和推广自家产品这个神来之笔。

在国内，假如今天你作为初创互联网公司，想要推广一款自家的AI 产品，你能去哪里呢？首选是小红书，请人在那里写关于你家新产品的笔记，然后靠着好姐妹传播。次选是B站，请Up 主在那里拍摄使用你家新产品的教程，分享使用心得和成果。最后是抖音和微博，在那里增加一点曝光量，让人们知道这款新产品的存在，以及它能做什么。

Midjourney 它们早就不走类似的道路了。许多海外的互联网新产品，目前都是直接入驻Discord，在那里建立起聊天频道。这种做法最大的优点是：用户可以直接教用户。当一名用户想要生成一张图片的时候，他需要在聊天频道里公开输入自己的指令。Midjourney 的机器人收到指令之后，会在频道里公开返回生成结果。其他用户如果觉得图片还不错，可以立即找到对应的指令，马上就能开始学习和模仿。

在Discord 的聊天室里，大家在不断输入指令，系统在不断返回图片，如同流水一般连绵不绝，看起来大概像是下面这个样子：

比如说，你现在看到这张机械狗的图片，觉得大有可为，自己也想做一张类似的。那么在图片上方就是具体的指令---corgi humanoid, h.r. giger 。一个完全不懂英文的中国用户，看到这行字也能立即通过翻译软件进行查询和学习：

corgi，哦，这是小短腿柯基的英文；humanoid，哦，这是类人机器人；h.r. giger，哦，这是瑞士超现实主义艺术家Hans Ruedi Giger，他擅长画人形机械生物，当初是电影《异形》的设计者之一；Style，斯待，风格的意思。整条指令加在一起理解，那就是依照画家Giger 的风格，绘制一张柯基的人形机械人的画。

频道里所有的人都能看到，看到了就能学习，学到了当场就能自己亲手尝试一次---所以我说这是新产品运营上的神来之笔，完全是思维模式上的不同。无论是小红书，还是B站抖音微博，目前的传统推广模式还是自上而下，从某个大神，某个大V 开始，自上而下教育其他用户。但是在Discord 频道里，却是用户之间相互平行教育，相互平行启发，学习速度和效率不知道高了多少倍。并且，这种现场教学现场尝试的方式，在吸引用户扩大传播上，速度和效率也不知道高了多少倍。

关于这种运营模式，我其实之前在《教小朋友用Midjourney》一文的中后段有过详细的介绍。

回到那位抱怨Midjourney 不好用的大叔，他大概从未意识到这种问题。在使用了没几分钟之后，就开始了抱怨。我能理解这种抱怨，他真正抱怨的是Midjourney 官方没有按照他的习惯，他的偏好，给他提供一个网站。在那个网站里，做好一个巨大的输入框，方便他输入绘画指令。在输入框的右下角，有一个大大的“生成”按钮。最后，页面下方是他过去生成的图片历史---

如果Midjourney 把自己的产品做成这样，他就会感觉到熟悉和亲切，这就是他认为的互联网产品，尤其是互联网工具应该有的模样。而这里所说的“应该”，其实并不是表示一种真理或者规定，它的真实意思是：人们过去是这么做的，那么现在也应该依然那么去做，否则的话，就值得抱怨一番。

所以我建议他去检查一下自己身份证上的出生年月，就像是我曾经做过的那样。上网二十多年，越到后来我越明白一件事：互联网世界从根本上是偏向新生代的，是偏好年轻人的，总是会优先满足他们的喜好和需求。我觉得什么新产品不好用，不顺手，尤其不是功能上的缺失，而是我个人使用习惯上的不适应，那么我会去看一下我的身份证，问自己三句话：

---我是不是太老以至于学不会新东西了？

---我是不是太老以至于觉得我年轻时的一切都应该是圭臬？

---我是不是太老以至于拒绝去理解我所不熟悉的形态下面的真实用意？

经常问这三个问题，我就可以克服自己内心的惰性和抗拒，减少很多无谓的抱怨。为了学习使用AI 软件绘画，我得学习如何在本地部署Stable Diffusion 这样的开源软件。为此，我必须重新学习在VScode 里面使用命令行进行操作；同样的，我也得学习如何使用Midjourney 这种封闭商业软件。为此，我必须前往对于我而言全然陌生而且功能繁多的Discord，从零开始。

在一开始，内心会有畏难情绪，情绪会有焦躁不安，但通过反复问这三个问题，这一切负面因素都能克服，注意力最终还是能转回学习上去。今天在互联网上所有我感到顺手的存在，都源自我的年轻时代，不是因为我的缘故。因为那时候我年轻，互联网世界围绕着我这样的人做服务。今天在互联网上所有我感到艰涩的存在，原因是我自己已经不是互联网服务的主要目标，所以我得加紧两步赶上，因为没有人会等我，互联网的列车上并没有设立中老年人专座。

二三十岁时，抱怨是活力的象征；四十岁之后，抱怨是衰老的征兆。可能有很多人会不同意，但我就是这么想的。

Power by Midjourney V5.1

Prompt: woman in blue dress standing near tree branches, in the style of floral surrealism, samyang af 14mm f/2.8 rf, terracotta, hyperrealistic fantasy, light crimson and sky-blue, distorted, exaggerated figures, tabletop photography, --v 5.1

2023-05-15

一件值得高兴的小事

昨天深夜，一位名叫秋婉的读者留言向我表示感谢。她在自家孩子幼儿园举办的园徽设计大赛中胜出，从今而后，那家幼儿园会使用她的设计方案作为官方徽章。秋婉感谢我，说是因为我这一路走来不断分享AI 绘画方面的内容，促使她走进这个新世界，这次她的获奖作品就是她自己用AI 绘制出来的成果。

听闻这个消息，我很高兴。从去年5月18日我用AI 绘制第一张插图到现在，还不到一整年时间。在这个过程中，我经历过很多次来自读者的质疑，来自读者的打击。记得在早期的时候，不止一位读者严肃地留言劝说我放弃，并且表达了他们对AI 绘画的强烈厌恶之情。

一直到今天，每次发布文章之后，还有读者会留言挑错，不断指出画作里的人物表情有问题，手指有问题，透视有问题，以及灵魂有问题。所以，我根本没有预料到有读者会因为我的缘故而受到鼓励，真的去了解和学习AI 绘画，而且最终取得了个人成果，获得起码一家幼儿园从教师到家长的认可。

秋婉在留言中说：“您说的没错，为 AI 能不能代替人，有些人忙着打口水仗，而像我这种人，都是悄悄滴干活，学起来再说”。

我为秋婉感到高兴，也为我自己感到高兴。我喜欢她在这句留言里流露出来的那种精神气，她知道自己要什么，她也知道应该怎么去做，更知道如何巧妙地隐藏在人群之中，一步一个脚印抵达自己的目标。

不像是我，因为是公开地去做AI 绘画，因此要去面对无数迎面而来的否定和批评。如果我的精神世界稍微孱弱一些，那么可能早在去年6月份就已经放弃。为此，我在这里想再次提醒各位读者几件事：

在我们的文化里，在我们的日常生活中，常年缺乏对他人的肯定，人际关系中无论是单位还是家庭，又或者是朋友圈子，基本的氛围是否定。因为空气中充斥着这种消极和负面信息，所以如果你要去做任何事情，最好别出声，别让人知道，自己径直去做，就像秋婉那样。只要你出声，只要你让人知道，就一定会有许多人不请自来，对你和你的行动做出点评，而且点评一般都是以否定为主，会让人心情不好。

同样的，这里也常年缺乏对他人的鼓励。仿佛肯定他人就已经是个人的人生失败，鼓励他人就更是一种人生耻辱一般。在鼓励和打击之间，人们更倾向于后者，也许是因为这样可以让自己觉得更有力量吧。尤其是面对新鲜事，新举措的时候，人们的态度更是如此。根据我多年来的生活经验，人们鼓励趋同，反对标新立异，这是刻在大多数人骨子里的文化基因。

你总可以把你周围的高楼大厦想象成一条小村，当大家都在弯着腰整齐划一地种水稻时，你试图引种猕猴桃改善一下收成那就是大逆不道，没有什么人会拍拍你的肩膀说：你大胆地去做，能够蹚出一条新路的话，大家都会感谢你的。你得和大家一样种完水稻之后，拖着疲惫的身体回家，去自己家后院里悄悄侍弄你的猕猴桃树，而且最好把它藏在许许多多杂树之间。

最后一点，那就是在这座广袤无边包罗万有的村落里，所有真正想做并且做了点什么事情的人，他们大多倾向于去做但却不说。而大多数人乐于去说，他们所说的话和事情本身没有多大关系，不会涉及到具体的方式、步骤、技巧，只会是否定和批评。他们对于事情并不关心，他们关心的是可以通过否定和批评，以此维护自己的审美，维护自己的品位，维护自己的眼光，维护自己的形象。他们甚至会非常认真严肃地投入其中，做出许多精妙严谨的论证，但无一例无会小心翼翼地避免接触任何具体的事，小心翼翼地避免一切创造和创作。

因此，在这样的生活中每个人都背负着一项相同的使命---从喧闹的话语之外，去找寻那些沉默不语但是能做成事情的人。你得关闭耳朵，你得睁大眼睛。你得把目光中人群的中心移向边缘，你得去那些暗影里找寻，在那些丛生的杂树之间小心分辨，把做事情的人找出来，然后努力生活在这样一群人中间。我认为，这是充实和幸福人生的基础。

相信在秋婉之外，也有许多读者正在默默地学习使用AI 绘画，也在其中找到了乐趣。我很高兴在这个过程中，充当那个站在前方吸引炮火的人。我想，秋婉她们可以通过对我的观察，得出一个宝贵的结论：在这样一个社会里生活，遭受否定和批评固然很糟糕，但是人们还是可以凭借着简单而顽固的信念而前进。比如说和菜头这个人，当初就是为了得到几张免费的文章插图，舍不得花钱去购买图片库会员，竟然就那么自己画了一整年。

---

订阅：博文 (Atom)

槽边往事