显示标签为“Midjourney”的博文。显示所有博文
显示标签为“Midjourney”的博文。显示所有博文

2023-06-15

孙悟空大战奥特曼

 


昨天我收到一条留言,来自一位名叫王珂Vanchael 的教师​,他说:
“我在村里教书,今天给学生们展示了一下midjourney的效果。他们很惊讶,就想让我画奥特曼。我大手一挥,豪气地说:那就画个奥特曼和孙悟空踢足球吧。我还特地用ChatGPT帮忙翻译了一下。 结果,玩砸了,画面没有奥特曼,也没孙悟空,只是一只类猴子生物在踢球。 孩子们很给面子,没嘘我,但我还是不好意思。 能画出自己想画的,还是太难。”
这条留言出现在文章《不期而遇的黑T恤》后面,它让我相信王老师是一位​很好的人民教师。一方面是因为他愿意想办法帮助孩子们开拓眼界,让他们和​这个世界同步,同时也在​试图激发孩子们宝贵的想象力。
另外一方面是因为他的情商很高,我写的那篇关于黑 T 恤的文章,主要内容是讲我无法找到一件我心仪的 T 恤。留言区里就有许多读者建议我先用 AI 画出来,然后再用​图片搜索去找。王老师写了那么一段个人经历,最后落脚在“能画出自己想画的,还是太难”这句话上,我认为他的情商最起码有 185​,对于孩子们而言​是一件极为幸运的事。
所以王老师也不用太失望,从昨天看到您的留言之后,我就​做了一些尝试。接下来的这批图片您可以拿去给同学们看看,还有一些话也请一并帮我带给他们:
奥特曼和孙悟空踢足球,这个场景的确很难用 AI ​画出来。原因是人的想象力要比 AI 强,你现在想象一个金盔金甲的孙大圣很简单,再想象一个穿红色紧身衣戴面罩的奥特曼,也很简单。然后,你就可以想象他们两个在绿色的球场上你来我往踢足球。
​ AI 不是这样。AI 要看一遍所有关于奥特曼的电影电视剧,这样它才能学会所有奥特曼的特征,学会画出​一个奥特曼来。而且不止如此,AI 还学习了整个奥特曼的世界,那里的建筑,那里的怪物,那里的景色,​一整套,全都学下来。
对于孙悟空也是一样,AI 不单学习了孙悟空的金箍棒,他的盔甲,他的虎皮裙,还得一并学习那个神仙世界,凌霄殿、广寒宫、蟠桃园、​盘丝洞等等等等,也是一整套全都学了下来。
​问题是,对于 AI 而言,这两个世界是不相容的。你要以孙悟空为主,那么孙悟空世界里出现一个奥特曼,这个奥特曼就得穿中式盔甲,或者中式长衫,手持拂尘​、宝塔、照妖镜一类的法器。你要以奥特曼为主,那么孙悟空也得穿上机甲,​要么就是一个赤身露体的多毛猴子,​这就是奥特曼世界里常见的事。同时让他们俩各自保持自己的风格,然后在同一个场景里出现,AI 很难直接画出这样的​景象,需要大量额外的工作。
所以我算了一下:孙悟空和奥特曼踢足球,​在孙悟空的西游记世界里不存在足球这件事,所以只能请孙大圣前往奥特曼的世界,这样​足球才踢得起来。那么,孙大圣就不大可能保持《西游记》里的造型,会变成下面这个样子:

虽然形象上发生了一点改变,但是风格上​孙悟空和奥特曼就得到了统一。​这同时也解决了一个很让人头痛的问题:怎么踢?按照西游世界的设定,孙悟空会七十二变,手里有极为沉重的金箍棒。他变成万丈高的巨人,一脚就可以把奥特曼连人带球踢出地球,这还怎么踢?按照奥特曼的设定,奥特曼要痛打小怪兽,小怪兽现在可以七十二变,金刚不坏,​你让奥特曼怎么打?
所以,最后双方只能变成穿奇特服装的足球运动员,只能使用足球运动员的体能和技术​,大家才能把球踢下去。但他们又不能是足球运动员,所以只能用服装,用姿态,​把他们和凡人区分开来。那么,他们在绿茵场上​就不能飞天遁地,只能这样:

主要是展示身材,展示盔甲,展示姿态,踢不踢球​没那么重要。当然,之前说了要踢足球,​那么也可以这么来一下:

是的,不大像人类的足球赛,​倒是更像两个机械人在肉搏。但我觉得没多大关系,因为谁也没有见过孙悟空和奥特曼踢足球,​这也许画的就是他们的第一场球。
然后踢球​的重点也不在球,而在于球员的身姿,只要姿势帅就好。反正我们也无法想象出 90 分钟的比赛,能够想象的也就是传球、铲球、拦截这样的具体动作​:

当然,你看到这里也许会说​:这不是孙悟空,也不是奥特曼,​根本就不像嘛。​当然不像,从第一张图开始就不像。但是我一开始说,这就是孙悟空,然后你就可以在​图片里分辨出谁是孙悟空,谁是奥特曼。为什么?因为你的想象力在发挥作用,就像是天空中的云彩,​只要谁指着其中的一团说:看!​那是一只小狗!​然后大家就可以从各种平平无奇的云团里看出各种各样的东西,那就是想象力在发挥作用。
今天 AI 可以画一些从未出现过的画面,实现一些漂亮的效果,不过和人类的想象力相比,​AI 还是相形见拙。就像是现在,凭借着几张画,你已经可以放飞想象,去幻想一场孙悟空和奥特曼的足球赛会是怎样的,而在你的想象中,要比我这些图片更合理,更具体,也更精彩。我打赌你现在肯定已经想到了​一件事:场上的孙悟空用汗毛变成一整支足球队,每个队员都长得一模一样,让奥特曼很是觉得头晕。
人类所能做的事情还不止于此。比如说一个人使用 AI 工具画图,觉得自己画得不好,可以去找一个千里万里之外的陌生人---大家甚至相互根本不认识,但是对方就有可能​试着帮忙画上几张。这种事情,AI 可做不到。
而一个人在网上找到另外一个陌生人,只是讲述了一下自己的故事,甚至都没有开口要求帮助,对方就愿意主动帮忙,因为被文字的内容和蕴含的情感所打动。这种事情,不单 AI 做不到,很多人也​根本做不到。
所以,各位同学,​你们很幸运能够拥有这样一位老师。他为你们展示了未来,展示了互联网的力量,也展示了人和人之间奇妙的联系。我认为,他给你们上了很精彩的一课,我作为这一课的教具,​深感荣幸。我希望你们能喜欢这些 AI 绘画作品,我也更期待你们能够接触和学习 AI ,做一些比绘画更有趣​更复杂的事情。
​最后,王老师您并没有玩砸,您为学生上了一堂​很好的课。​谢谢您。


和菜头  上
2023 年 6 月 15 日
于北京

又及:老师,您不会是在分众美丽小学吧​?谢谢你那么用心照我家乡的孩子们。


------

2023-05-17

抱怨前想想自己的年纪



网上每天都能看到抱怨,但我认为那是年轻人的特权,不大适合中老年人。今天我看到一个中年男子,在网上抱怨AI 绘画工具Midjourney 难用。这让我一下子来了兴趣,因为我已经用了很长一段时间,感觉相当不错。

他抱怨的理由是Midjourney 没有提供一个他熟悉的工作界面,而是要让他去另外一个叫做Discord 的聊天软件,在软件的聊天频道里生成图片。看到他的理由,我觉得在检讨Midjourney 的得失之前,他应该先去检查一下自己身份证上的出生年月。
几周前,中文互联网上有一批流行帖子在介绍Midjourney ,传播的核心点是“11个人的小团队支撑起AI 绘画方向的巨头公司”。这是个事实,Midjourney 团队没几个人,但是拥有上千万用户,创造了上亿美金的营收,比当年的Instagram 还要厉害。不过,在这些介绍Midjourney 的帖子里,却极少提到他们使用Discord 来运营和推广自家产品这个神来之笔。
在国内,假如今天你作为初创互联网公司,想要推广一款自家的AI 产品,你能去哪里呢?首选是小红书,请人在那里写关于你家新产品的笔记,然后靠着好姐妹传播。次选是B站,请Up 主在那里拍摄使用你家新产品的教程,分享使用心得和成果。最后是抖音和微博,在那里增加一点曝光量,让人们知道这款新产品的存在,以及它能做什么。
Midjourney 它们早就不走类似的道路了。许多海外的互联网新产品,目前都是直接入驻Discord,在那里建立起聊天频道。这种做法最大的优点是:用户可以直接教用户。当一名用户想要生成一张图片的时候,他需要在聊天频道里公开输入自己的指令。Midjourney 的机器人收到指令之后,会在频道里公开返回生成结果。其他用户如果觉得图片还不错,可以立即找到对应的指令,马上就能开始学习和模仿。
在Discord 的聊天室里,大家在不断输入指令,系统在不断返回图片,如同流水一般连绵不绝,看起来大概像是下面这个样子:


比如说,你现在看到这张机械狗的图片,觉得大有可为,自己也想做一张类似的。那么在图片上方就是具体的指令---corgi humanoid, h.r. giger 。一个完全不懂英文的中国用户,看到这行字也能立即通过翻译软件进行查询和学习:
corgi,哦,这是小短腿柯基的英文;humanoid,哦,这是类人机器人;h.r. giger,哦,这是瑞士超现实主义艺术家Hans Ruedi Giger,他擅长画人形机械生物,当初是电影《异形》的设计者之一;Style,斯待,风格的意思。整条指令加在一起理解,那就是依照画家Giger 的风格,绘制一张柯基的人形机械人的画。
频道里所有的人都能看到,看到了就能学习,学到了当场就能自己亲手尝试一次---所以我说这是新产品运营上的神来之笔,完全是思维模式上的不同。无论是小红书,还是B站抖音微博,目前的传统推广模式还是自上而下,从某个大神,某个大V 开始,自上而下教育其他用户。但是在Discord 频道里,却是用户之间相互平行教育,相互平行启发,学习速度和效率不知道高了多少倍。并且,这种现场教学现场尝试的方式,在吸引用户扩大传播上,速度和效率也不知道高了多少倍。
关于这种运营模式,我其实之前在《教小朋友用Midjourney》一文的中后段有过详细的介绍。
回到那位抱怨Midjourney 不好用的大叔,​他大概从未意识到这种问题。在使用了​没几分钟之后,就开始了抱怨。我能理解这种抱怨,他真正抱怨的是Midjourney 官方没有按照他的习惯,他的偏好,给他提供一个网站​。在那个网站里,做好一个巨大的输入框,方便他输入​绘画指令。​在输入框的右下角,有一个大大的“生成”按钮。最后,页面下方是他过去生成的图片历史---
如果Midjourney 把自己的产品做成这样,他就会感觉到熟悉和亲切,这就是他认为的​互联网产品,尤其是互联网工具应该有的模样。而这里所说的“应该”,其实并不是表示一种真理或者规定,​它的真实意思是:人们过去是这么做的,那么现在也应该依然那么去做,否则的话,就值得抱怨一番。
所以我建议他去检查一下自己身份证上的出生年月,就像是我曾经做过的那样。上网​二十多年,越到后来我越明白一件事:互联网世界​从根本上是偏向新生代的,是偏好年轻人的,总是会优先满足他们的喜好和需求。我觉得什么新产品不好用,不顺手,尤其不是功能上的缺失,而是我个人使用习惯上的不适应,那么我会去看一下我的身份证,问自己三句话:​
---我是不是太老以至于学不会新东西了?
​---我是不是太老以至于觉得我年轻时的一切都应该是圭臬?
---我是不是太老以至于拒绝去理解​我所不熟悉的形态下面的真实用意?
经常问这三个问题,​我就可以克服自己内心的惰性和抗拒,减少很多无谓的抱怨。为了学习使用AI 软件绘画,我得学习如何在本地部署Stable Diffusion 这样的开源软件。为此,我必须重新学习在VScode 里面使用命令行进行操作​;同样的,我也得学习如何使用Midjourney 这种封闭商业软件。为此,我必须前往对于我而言全然陌生而且功能繁多的Discord,从零开始​。
在一开始,内心会有畏难情绪,情绪会有焦躁不安,但通过反复问这三个问题,​这一切负面因素都能克服,注意力最终还是能转回学习上去。今天在互联网上所有我感到顺手的存在,都源自我的年轻时代​,不是因为我的缘故。​因为那时候我年轻,互联网世界围绕着我这样的人做服务。今天在互联网上所有我感到艰涩的存在,原因是我自己已经不是互联网服务的主要目标,所以我得加紧两步赶上,因为没有人会等我,互联网的​列车上并没有设立中老年人专座。
​二三十岁时,抱怨是活力的象征;​四十岁之后,抱怨是衰老的征兆。​可能有很多人会不同意,但我就是这么想的。

Power by Midjourney V5.1
Prompt: woman in blue dress standing near tree branches, in the style of floral surrealism, samyang af 14mm f/2.8 rf, terracotta, hyperrealistic fantasy, light crimson and sky-blue, distorted, exaggerated figures, tabletop photography, --v 5.1

2023-05-15

一件值得高兴的小事

 


昨天深夜,一位名叫秋婉的读者​留言向我表示感谢。她在自家孩子幼儿园举办的园徽设计大赛中胜出,从今而后,那家幼儿园会使用她的设计方案作为​官方徽章。秋婉感谢我,说是因为我这一路走来不断分享AI 绘画方面的内容,促使她走进这个新世界,这次她的获奖作品就是她自己用AI 绘制出来的成果。
听闻这个消息,我很高兴。从去年5月18日我用AI 绘制第一张插图到现在,​还不到一整年时间。在这个过程中,我经历过很多次来自读者的质疑,来自读者的​打击。记得在早期的时候,不止一位读者严肃地留言劝说我放弃,​并且表达了他们对AI 绘画的强烈厌恶之情。
一直到今天,每次发布文章之后,还有读者会留言挑错,不断指出画作里的人物表情有问题,手指有问题,透视有问题,以及​灵魂有问题。所以,我根本没有预料到有读者会因为我的缘故而受到鼓励,真的去了解和学习AI 绘画,而且最终取得了个人成果,获得起码一家幼儿园从​教师到家长的认可。
​秋婉在留言中说:​“您说的没错,为 AI 能不能代替人,有些人忙着打口水仗,而像我这种人,都是悄悄滴干活,学起来再说”。
​我为秋婉感到高兴,也为我自己感到高兴。我喜欢她在这句留言里流露出来的那种精神气,​她知道自己要什么,她也知道应该怎么去做,更知道如何巧妙地隐藏在人群之中,​一步一个脚印抵达自己的目标。
不像是我,因为是公开地去做AI 绘画,​因此要去面对无数迎面而来的否定和批评。如果我的精神世界稍微孱弱一些,​那么可能早在去年6月份就已经放弃。​为此,我在这里想再次提醒各位读者几件事:
在我们的文化里,在我们的日常生活中,​常年缺乏对他人的肯定,人际关系中无论是单位还是家庭,又或者是朋友圈子,基本的氛围是​否定。因为空气中充斥着这种消极和负面信息,所以如果你要去做任何事情,最好别出声,别让人知道,自己径直去做,就像秋婉那样。只要你出声,只要你让人知道,就一定会有许多人不请自来,对你和你的行动做出点评,而且​点评一般都是以否定为主,会让人心情不好。
​同样的,这里也常年缺乏对他人的鼓励。仿佛肯定他人就已经是个人的人生失败,鼓励他人​就更是一种人生耻辱一般。在鼓励和打击之间,人们更倾向于后者,也许是因为这样可以​让自己觉得更有力量吧。尤其是面对新鲜事,新举措的时候,人们的态度更​是如此。根据我多年来的生活经验,人们鼓励趋同,反对标新立异,​这是刻在大多数人骨子里的文化基因。
你总可以把你周围的高楼大厦想象成一条小村,当大家都在弯着腰整齐划一地种水稻时,你试图引种猕猴桃改善一下​收成那就是大逆不道,没有什么人会拍拍你的肩膀说:你大胆地去做,能够蹚出一条新路的话,大家都会感谢你的。你得和大家一样种完水稻之后,拖着疲惫的身体回家,去自己家后院里悄悄​侍弄你的猕猴桃树,而且最好把它藏在许许多多杂树之间。
最后一点,那就是在这座广袤无边包罗万有的村落里,所有真正想做并且做了点什么事情的人,他们大多倾向于去做但却不说。而大多数人乐于去说,他们所说的话和事情本身没有多大关系,不会涉及到具体的方式、步骤、技巧,只会是​否定和批评。他们对于事情并不关心,他们关心的是可以通过否定和批评,以此维护自己的审美,维护自己的品位,维护自己的眼光,维护自己的​形象。他们甚至会非常认真严肃地投入其中,做出许多精妙严谨的论证,但无一例无会小心翼翼地避免接触任何具体的事,小心翼翼地避免一切创造和创作。
因此,在这样的生活中每个人都背负着一项相同的使命---从喧闹的话语之外,去找寻那些沉默不语但是能做成事情的人。你得关闭耳朵,你得睁大眼睛。你得把目光中人群的中心移向边缘,你得去那些暗影里找寻,在那些丛生的杂树之间小心分辨,把做事情的人找出来,然后努力生活在这样一群人中间。​我认为,这是充实和幸福人生的基础。
相信在秋婉之外,也有许多读者正在默默地学习使用AI 绘画,​也在其中找到了乐趣。我很​高兴在这个过程中,充当那个站在前方吸引炮火的人。我想,秋婉她们可以通过对我的观察,​得出一个宝贵的结论:在这样一个社会里生活,遭受否定和批评固然很糟糕,但是人们还是可以凭借着简单而顽固的信念​而前进。比如说和菜头这个人,当初就是为了得到几张免费的文章插图,舍不得花钱去购买图片库会员,竟然就那么自己画了一整年。​

------

近期热门博文