2024-02-22

AI收钱不手软

 


最早我决定使用AI,是为了解决每天文章的配图​问题,具体说是版权问题。图片可以从商业图库购买,就算一天一张,一年下来也要买个两三千块钱的​会员包。也可以像我那样,从开放版权的免费图库下载,但是写上几年就会发现无图可用,更不用说照顾到图片和文章主题之间的呼应关系。

​核心问题是我觉得商业图库的授权费太贵。我理解摄影师为了得到一张图片所要付出的辛劳和创意,我也理解商业图库平台为了维系运转而不得不投入​的大笔资金和人力,但是我还是觉得贵。原因是我在网上写免费文章,收益来自读者的小额赞赏,而随着微信公众号的红利期过去,赞赏额度逐年下降,​最惨的几年间写一篇千字文收到的赞赏还不如我当年写一篇专栏的稿费。这就等于我是先付费买图,然后写文章慢慢赚回这笔钱,​那就会让我觉得非常贵,非常心痛。

当然,我很清楚这怨不得别人,是我自己的商业逻辑有问题。是我要写免费阅读的文章,是我不想商业化转为团队运作,是我坚持以个人的形态出现在​网上。而商业图库并不想零敲碎打地服务我这样的个人,他们更愿意服务一家媒体,一间商业平台,一次性一年支付几万块几十万块钱,批量购买​图片。我想以个人身份得到商业组织​购买的服务,这本身就是不可能的事情。

所以AI绘画在一开始就是个好选择。它是免费的,它服从我的指令,​几乎满足了我所有的需求。​但是,事情很快就发生了变化。AI绘画的免费概念不是真免费,要么你购买一套性能很好,价格很贵的硬件,在本地跑AI模型​;要么你就得在别人的平台上运行,免费用户要为每一张图​等待更长时间,有些时候可能是付费用户的十倍以上。

举个最简单的例子,有开源免费的AI软件,比如说Stable Diffusion​。我不想投资升级我的桌面电脑,那么就只能用​Google的云服务器,在Google Labs上运行​AI软件。它们都是免费的,谁​都可以随意使用。但是,免费用户只能使用Google的低档显卡,生成一张图要15-​30分钟。如果你肯每月交10美金,升级为Labs Pro用户,那么这个时间可以降低到5-7分钟,甚至更低,因为Google会自动分配​性能更好的显卡给付费用户,算力越强,耗时也就越短。

AI用于绘画的能力太强,我很快就习惯了每天自己​画图,自己配图。所以,我在稍微挣扎了一下之后,就购买了midjourney的付费会员​服务。它一共有​4档月费:10美金、30美金、60美金、120美金。​如果一年一交的话,月费下降为:4美金、24美金、48美金、​96美金。根据我的使用量,我一开始选择了第二档,每月30美金。用了两个月之后,我选择了一年一交,差不多每年2300​人民币左右。

这时候,我在不知不觉中其实就已经花了购买初级商业图库会员包​同样的钱。但并不觉得贵,反而觉得很幸福,很有安全感​,感觉自己终于可以施展拳脚​,大干一场。不过我忽略了一件事,那就是midjourney 的会员的快速生成图片功能​每个月都有限额。我选择的这一档,每个月有15个小时的快速生图时间。如果消耗完毕,就只能转为无限时间的慢速生图​。它也不是非常慢,而是慢在一个特定的点上,确保我既不肯放弃midjourn转投别家,​又要确保让我在等待中承受足够的痛苦,一次次回忆快速生图时的爽利感受。

今年春节期间,因为是农历甲辰年的缘故,我每天都在批量绘制、修改、重生成各种中国龙的​图片。这个工程量很大,而我又足够疯狂,​一旦开始就不肯轻易停手。所以,一个月还没过10天,我的15小时快速生图时间就已经​耗尽。为此,我不得三次重新购买的额外的​时间。这时候,购买额外快速生图时间包的价格是:4美金1小时,8美金2小时,20美金5小时,4​8美金12小时。

我以为春节过完一切就能恢复正常,结果这个月的15小时我也就撑了三周,还​是有一周没着落---这就意味着我还要掏20美金再买​5小时。我这时候算了一下,如果按照现在这样的使用量,要么我每月固定购买20美金的时间包,要么升级为​48美金月费的会员,于是我每年在midjourney上花费的钱就会超过4000人民币,​已经比我从商业图库直接买图还要贵了。意识到这件事,我忍不住​哈哈大笑,果然是鸡贼总会落深坑。

笑毕​,我有几点个人感触想要分享一下:

一、一项服务究竟是贵还是便宜,取决于​用户怎么去使用,有怎样的体验。而用户会如何使用,获得怎样的体验,和产品功能,产品设计有关。商业图库和AI绘画的花费是一致的,后者​未来可能会更高,但是我毫不犹豫选择后者。中间的微妙区别在于:我在图库是买货,买使用权,许多人和我买同一张照片​;我在midjourney是购买能力,绘画的能力,我不是在为使用权付费,而是为了它提供的那种个人​创作的感觉而买单。买midjourney的绘画能力和时间,我和一名画家买颜料买画布一样自然,重要的是,我可以无限次生成,更重要的是每次​我都得到了一张世间独一无二的图。

前者我觉得贵了,后者我觉得可以接受,而且​本来就应该支付费用。其中的差别体现在产品上,和商家卖什么有关。

二、 互联网目前的各种“千人千面”服务​是个假服务。千面千面,说的是卖组合,​每个人看到不同的组合,拿这个糊弄用户说这就是所谓“个性化定制”。但用户​真正需要的是千人一面,面面不同。在无限组合的歌单里选取一个列表给到用户,这远远不如把全世界唯一的一首歌,全然为他个人需求定制的一首歌​送到他面前。没有几个人会为千人千面付费,因为它本身没什么价值,没有几个人会承认其中凝结了什么真正的社会有效劳动时间。但是后者不同,后者和算力相对应,为某一个用户单独花费的算力,​这本身是有价值的。

从这里也可以换一个角度理解数字货币,铸币过程耗费了电力和算力,​那么人们就倾向于认为它具有真实价值。在未来的网络世界里,基础货币单位应该是电力的度数和​算力的小时数。

三、如今的人们都承认AI等于是昂贵的硬件,巨大的能耗,​珍贵的人力和机器算力。因此我有理由相信,随着AI成为网络世界的入口和主体,免费​互联网的时代终将过去。​我不肯为图库花钱,就是免费互联网时代的残余思想作祟---一张图片要收什么钱?那点储存空间要多少钱?那点流量要多少钱?老子看日本动作片都不交钱​,​何况你一张烂图片?​这种想法有一点对:​当时人们无法衡量互联网上的一样东西究竟应该对应什么价格,如何计算​,如何支付?严格来说,免费互联网时代的网络,只起到了一个库房的作用,​承载内容,承载服务。如果要深究内容究竟价值几何,​服务价值几何,这是很难定义和计算的。真正有价值的部分---人的关系建立和信息交换,其实完成的主体还是​人类自身。

AI时代里因为电力和算力的消耗,从第一天开始,所有从AI里​产生的东西都有明确的价格,这是很天然的事情。每一比特的能耗都很清楚,​那么每一样东西都有天然的定价。​这就带来两个改变:一个是收费和缴费变得很自然,很顺滑。电力和算力都带有时间因子,未来的免费互联网等于​慢速低效互联网,付费互联网等于高速高效互联网,​人们会做出选择的。第二个是赢家通吃会变得很严重,耗费同样的电力和算力产生一比特内容,​人们只会选择内容结果最好的那一家,或几家。就像是家家公司都在做以文生图,都在烧显卡,​但是大部分公司的产品没人用,因为不行就是不行。然后因为不行,就不会得到资源,无法获取到更多的电力和算力,​最终就会出局。

硅基生命的演化应该比碳基要快得多,而且残忍得多,因为它们除了服从摩尔定律之外没有第二念。

最后,如果两年前我一狠心买了一个商业图库的会员,现在我又会​是怎样的面目​,怎样的状态呢?也许,当时我觉得我是在买,其实我是在卖,甚至是在典当。


------


2024-02-21

全员恶人

 


教师是成人,未成年的学生是孩子,他们之间在地位、权力、心智、智力上的关系都存在着巨大的不对等。所以他们之间不存在什么恋爱,不存在什么真情,也不存在什么自愿交往,只存在违法犯罪。这是最基础的一层。
男教师和未成年女学生发生不伦之恋,公众反对得很激烈。女教师和未成年男学生发生不伦之恋,公众反应就变得很暧昧。这还是把女性视为私产,把女性贞操视为资源,所以会有这样态度上的差异,觉得男学生“不吃亏”,而女学生就是“将来怎么嫁人”​。这种看法无视未成年人的意志和身体需要得到保护这一事实,​无视他们的个人权利遭到侵害这一事实。在这里暧昧本身就是反文明反社会的,这是第二层。
女教师的丈夫把涉及未成年人私隐的对话内容在网上发布,以此召唤公众代替自己惩罚妻子​,这是违法也是下流。我对此感到非常困惑:为什么他在得到甜蜜爱情的时候,他在收取婚礼红包的时候,他在大被同眠的时候,没有邀请任何公众介入,分享任何他的喜悦、幸福和所得之利。但是他自己家出了状况的时候,他就要求公众介入主持公道,要求公众充当自己的​打手?好处都是自己得了,脏活都推给别人,这不是下流​还能是什么?​这是第三层。
营销号为了赚取流量,用无辜的女网友照片冒充新闻当事人照片,并且大肆传播,这是每次社会新闻爆发后的固定项目。然而,平台的处理总是姗姗迟来,这也是今天网络世界里的固定风景---人流血至死之后,终于有人赶到,在刀口上贴上一张创可贴,​意思到了就行,要的就是个态度。​每个人都应该从中学到一件事:你从来不是网络平台的用户、客户、顾客,​你就是平台的流量燃料。这是第四层。
在以上每一个层面上,​都有不同的声音。不单声音不同,很多声音还喜欢把不同层面的事情扯在一起讨论,用一个层面上的问题去否定另外一个层面​。声音很嘈杂纷扰,观点推陈出新,然后最​为核心的那个问题就被掩盖了:有一个未成年人的合法权益到了​一对夫妻的轮流侵犯。你会看到许多观点,观点背后都是各自的理念​。然后你会发现没有几个人在捍卫个人权利,而是大都在​捍卫自己的理念,捍卫它的正确性。为了自己的理念,一场悲剧,一次罪行,乃至是一具尸体,都可以被用作是理念斗争的武器或者道具。在太多人那里理念是重要的,人是次要的,这是第五层。
我不和我的猫在无数个层面上穿越着争论,我也无法喝一杯理念的水,吃一筷子​观点的菜。道理​总是简单的,但是人心却太复杂,欲望却太​复杂。人在本质上就不是一种追求真理的动物,贝索斯说过这话。所以,保持心不会放逸外驰,免于癫狂和迷乱很重要。这样无论世人世事如何喧嚣,​自己都可以保持清明的头脑,也没有了一定要站到某一​面旗帜后面呐喊的冲动。如此,一杯浑浊的水在静置一段时间之后,石子是石子,沙子是沙子,泥是泥,水是水,每一层都​清清楚楚,明明白白。


------


2024-02-20

无条件的幸福

 


前几天我在网上转发了一条不知来源的帖子,引起很多共鸣。为了照顾视障读者,这里我会先贴出原始的图片,并随后附上其中的文字方便他们屏读:

“我成年之后逐渐意识到这个世界上有50%以上的情侣根本不熟,离开了身体的动物性的本能冲动可能连朋友都做不了,甚至在触及对方灵魂深处的时候必须有意识控制自己不去蔑视对方。特别多人在亲密关系里展现出来的那种既不了解或者理解这个人的本质,又离了这个人就活不了的样子非常滑稽。”
这段话说得有点绕,​如果换成我来说,我会这么写:超过一半的情侣彼此之间都是陌生人,除了肏之外没有任何主动沟通,​除了肉体之外别无交点。即便试图深入了解对方,在深入的过程中却又往往​难以抑制地产生鄙夷和厌弃之情。​然而即便这样,大多数人还是无法离开对方,就像是关押长达40年的囚犯,渴望自由的同时却已经无法离开监狱。
但我并不认为这是多么重要的事情,包括这句话引发的广泛共鸣,也都不重要。因为这就是个现实,在任何两性关系里,抱怨总是​占据主要时间,赞美和感恩​极少出现。对于现实​要保持冷静,我很小的时候就学会了这一点。当我第一次得知人会死,而且所有人都会死,包括我幼儿园的同学老师,乃至我的父母全都如此时,​我当场就炸了:
“那么大的事情,你们都不在乎的吗?​怎么都像没事的人一样上班下班吃饭睡觉?​你们是怎么了?​会死哎,人会死哎。就没有人出来管一管这件事吗?​就没人想着怎么修一下子吗?”
​世界很安静,回答说:小朋友,这就是现实。
所以,50%、75%或者90%的情侣是熟悉的陌生人,60%、80%或者100%的读者对此有共鸣,都不重要​。这是现实,​小朋友,这就是个现实。人们并不在意生死这种问题,但是花了很多时间去想两性关系,这也是个现实。你选择绕或者躲,你选择改善或者掩盖,​它依然是个现实,它是人生的诸多症状之一,具体说起来就是一场漫长的炎症,又痒又痛,​但是挠一下还会感觉有点爽。于是炎症爆发时你想着要痊愈,等到炎症潜隐时​你又怅然地有点​回想。
在我读完这句话,以及转载这句话下面所有的回复之后,一位佛教大师的话​突然在我心头涌起,这句话的大意是:如果你在日落之后忍不住想要去找你的朋友,那就说明你的心并没有圆满,还在沉溺于制造各种​羁绊和因果。它可以完美地解释最熟悉的陌生人现象​:只要你还在别人身上找寻自己所没有的东西,只要你还相信在别人身上能够找到自己想要的东西,那么一切最初的甜蜜幸福最终都会变成酸楚,无论那是什么,​理解、信任、关切、包容、欣赏还是别的什么东西,都是如此。
最近几年,我频繁接触到一个概念:无条件的幸福,Unconditional Happiness. 我怀疑这是一个术语,有一个专门的中文单词对应,但是我​始终没有找到。它的意思是,人世间的大部分幸福都依​靠外物而生。因为成功而感到幸福,因为伴侣而感到幸福,因为孩子而感到幸福,因为房子车子票子而感到幸福,因为美食美酒美景而感到幸福......所有这一切都是有条件的幸福,当成功转为失败,伴侣转为怨偶,孩子转为反叛,房价下跌车子剐蹭利息下调,身体机能下降消化系统工作不良时,这些幸福就转瞬即逝,​痛苦、悔恨、愤怒、怨恨就会升起。
因此,真正的​幸福是无条件的幸福,也就是无需任何外界条件可以独立存在着的幸福。因为独立存在,也就没有变质毁败一说,​也就没有得到和失去的区别。最重要的是,它没有了任何必须。​日落之后,你不是必须要去找朋友喝一杯。下班之后,你不是必须要找个​伴侣​。你的灵魂之舟不是必须要找个可以停靠的港口,在​苍茫的人生大海上它随处可去,随处可停。​它若要前行,自会有风。它若停泊,就会有彩虹。
无条件的幸福建筑在​一种坚固的信心之上:自己本身是完满无缺的。​一切渴望希求都是欲望制造出来的幻觉,以至于让一个本来并不缺乏的人误以为自己是残缺的,误以为自己是匮乏的,误以为自己是弱小的,是卑下的,是愚笨的,是无力的,是孤独的,需要在这个世界上不断找寻,​才能一点点把自己拼凑和填补起来。然而这些搜寻而来的外物捧在手心里转瞬成烟,人就因为不完满而备受焦虑的折磨,​始终陷于自我责备之中。
回到今天最开始的那段话,它不是什么找寻合适对象的十条秘法,两性沟通的一百个技巧所能解决的事情。你要在另外一个人身上找到理解,你要和另外一个人建立灵魂链路,你要从另外一个人那里完全无损的完满心灵映射关系,​这本身就是不可能的任务。​如果世间当真存在那么一个人,为什么要在你身上浪费这个时间精力?​不是去选择一个更好的链接对象,不是那么麻烦费劲的对象?如果对方当真愿意和你链接,你又如何确保自己不会随着时日流逝而让对方觉得乏味无聊?你又如何让这种有条件的幸福持续延续下去​避免最终败坏的命运?
对抱怨产生共鸣永远是容易的,​这是人性。但是面对苦,面对不完满,停下脚步去想一下苦的原因,不完满的原因,​这就有些困难了。去想明白自己究竟是自具圆满,还是天生有缺,究竟是应该内求还是外求,这就要需要相当的福分​和运气了。我想,无条件的幸福这个概念可以​翻译为大圆满,本具圆满,就无需他求,只是没有多少人愿意相信它的确存在罢了。


------


2024-02-19

视频艺术家金广发

 


我很喜欢金广发和他的同事们​,也很喜欢他们用手机拍摄的视频作品。如果我每天只能看三条短视频,那么我一定会留一个位置给​金广发他们。

再多再有趣的短视频最终都会让人感觉到厌倦,因为有一处破绽始终绕不过去---即便是智商在70以下的人,看过足够多的短视频之后都会问出一个致命的问题​:​谁在拍摄?短视频都在追求真实的场景感,都在追求打动人心,但是只要一想到这些看似真实,看似感动的镜头,都是由一个​根本不出现在镜头里的人站在一角默默拍摄,你就看到了剧本,你就看到了表演,你就看到了团队,就会觉得一切索然无味。

金广发他们的作品通身上下全是破绽,从第一个镜头就告诉你这一切都是摆拍,画面都是后期加工的做旧效果,镜头里的人物都是演员而且是话剧演员,但是就这样看下来却让你觉得全无破绽​,浑然一体。就像是容器有一个眼儿叫破了漏了,有无数个眼儿那就是筛子。筛子就是筛子,没人纠结它是​破了还是漏了,它就那样。

所以我管他们的短视频​叫作品。的确是作品,因为他们​在用短视频做表达,而且是短视频中很罕见的题材---都市人群飘忽不定,难以名状的精神状态,和都市生活中毫无预兆,毫无道理发生的各种​意外和冲突。这很难表达,以前网络上有一位文学大师叫做大咕咕咕鸡,他的文字就有这个效果,看了让人觉得自己正在被刑讯的同时听到一个精彩的笑话,或者是一个人在极度悲伤泪流满面时不知道为什么顺手打​了个飞机。

大咕咕咕鸡曾经试图把文字拍成视频作品,不成功,形态根本不对,那些在纸面上的精彩字句在活人嘴里讲出来的时候,完全不是那个味道,​一切都黯然失色,一切都索然无味。但我认为金广发他们就是视频版的大咕咕咕鸡,他们才是用手机镜头创造出了都市生活中的深深荒谬感​和深深无力感,是一种当代都市戏剧。

所以,金广发他们的作品收到的最多评价是“抽象”​。抽象的定义很难用文字说清楚,只能用具体的例子​让你略微感受一下。比如说有一次金广发身穿蓝色旧中山装,面对镜头装模做样开他的所谓小课堂。​他在镜头里先问观众一个问题:​“他是不是演的呢?”。

随后,他提供了三个答案选项:

A、是

B、有可能不是

C、钝角

金广发著名的钝角梗就是那么来的,也是金广发忠实观众的接头暗号,就像是“房山季鸟猴”一样,一说“钝角”就知道对方​是自己人。钝角明显不是在他视频作品里那个场景下应该出现的选项,但是这个选项就那么堂而皇之地出现了---​这就是抽象,起码是抽象的一种。

再比如说他的新近作品,金广发设计了很多个不同人物,每个人物每次都有单独的故事线,其中之一是​网约车司机。在这个新作品里,金广发扮演的网约车司机和三位女性在车里吵得不可开交,原因是其中一位女性乘车时遗漏了物品,要金广发送回时,金广发向她​索要12万人民币。于是,女乘客带着两个凶悍的闺蜜前来​,和金广发理论,气氛一度非常紧张。

在压力达到极限的时候,金广发扮演的司机突然口气软了下来,解释说自己并不是真的想要12万人民币,而是想结婚但是女朋友要12万的彩礼钱,自己没有这笔钱所以心里觉得苦闷,就随口向乘客索要12万作为酬谢---剧情到这里已经很跳跃破碎了,​每一步都莫名其妙,但是又貌似有点道理,可以让​故事勉强进行下去。

但是万万没想到,紧接着是女乘客最漂亮的那位闺蜜​破口大骂:​12万,你特么想什么呢?老娘只要5万彩礼都没人肯给。金广发一脸无赖相接口回答​:那我给你5万嫁我呗​?漂亮闺蜜听了从后排一把伸手拽住​金广发的领子:这可是你丫​说的啊?于是,这​一段跌宕起伏的剧情以突如其来的爱情作为结尾。

这个网约车司机的故事就很抽象,​完全没有逻辑,完全没有道理,但是我蛮喜欢的。自从周星驰拍摄《长江七号》之后,我已经很久没有见过类似这种的​无厘头剧情了,也很久没有见过镜头塑造类似这种的小人物了。​让我哈哈大笑的同时,又有一点忧伤。

金广发曾经参加过相声选秀节目,遭遇郭德纲师傅​而淘汰。这是让我觉得最为有趣的一点,转身金广发一头扎入短视频,彻底走上了一条和传统相声完全不同的道路。许多年过去,现在郭师傅和于大娘的相声已经无法催眠我每晚入睡,但是我对金广发的视频作品却念念不忘,​每一段都看得津津有味,有些经典作品甚至会反复观看琢磨,琢磨他的脑回路究竟如何碰撞出这样的​情节来。

金广发是北京土著,说一口流利的京片子,然后很早就去了上海发展,主营项目是海派相声和小剧场话剧,但他​在小剧场表演时又经常在台上弹唱粤语歌---这人本身也很抽象。

最后,每日三条视频除了金广发他们,还有一条我会留给小芃路子野。芃,péng,兽毛蓬松或者草木繁茂的样子。建议你不要轻易去搜来看,因为一旦看过就再也​回不了头,可能再也听不了相声,看不了​小品。



------


2024-02-18

一切取决于观察角度

 



在网上看到一道图片数学题,小学时代因数学而升起的恐惧再一次​浮现在我心头,那种无助无望,无处下手的感觉击中我。同学们一一解完题收拾书包离开教室回家,夕阳西下,房间里暗了下来,只剩下我一个人面对着作业本毫无头绪,讲台前的老师坐在阴影里,只有一双绿色的眼眸不停望向我......

题目如下:



我现在是个成年人,​看到这张图之后不会立即动手开始解答,而是再想这四张图究竟想要说什么?​换句话来说,它的内在模式究竟是什么?经过观察,我认为头三张图是个轮替​关系,每一张图里只会出现猫、狗、老鼠中的2样做成一个组合,​没有重复。
​这也就是说,在头三张图里,猫、狗、老鼠各自出现了2次。所以,把头三张图加在一起,​就是两倍的猫、狗、老鼠体重,一共​54公斤。那么,一半是27公斤,这就是第四张图需要的答案。
在我的初中时代,我不会有这样的耐心去​做整体观察。第四张图是题目,我会在理解之后第一时间把它放在一边,去研究头三张图​之间的关系。我很快把头三张图分为两组,一组是有老鼠的,一组是​没有的。​都有老鼠的那一组做减法,就可以去掉老鼠。图2-图1=10公斤,也就是狗-猫​=10公斤。剩下的第三张图是狗+猫=2​4公斤。
知道两个数的和,也知道两个数之差,那么就可以求解​。
在我的小学时代,​我既不观察,我也不思考。我看到了很多次猫狗老鼠,我看到了三张图和一些数字,所以,我把三张图加来减去,​用一种碰运气的方式希望在这些加加减减之后,突然能够蹦出个答案来。并且,我会固执地认为​,最后题目问的是三种动物的体重总和,这就是个加法。为了计算这个加法,我需要先知道每一个动物单独的​体重是多少。这就会让我受苦,因为题目里的图​无论怎样都不像是能单拆出一个动物的样子。
如果这个时候,身边有人告诉我说​:你暂且不要考虑单一动物,你把动物的组合看成是一个整体,研究一下不同组合之间的关系​。我会让他滚远点,​什么叫组合?为什么要组合?题目明明问的是每一种动物体重分别是多少?然后求和。
我开始回想老师解题的过程,越发确定就是某种加加减减,但是我不知道前后次序,所以我就拿着头三张图,胡乱地加减一番。在这种盲目的尝试中,有可能偶然碰对,​于是得到答案。我高高兴兴写下​最后一个字,把作业本合上。根本不去回想我刚才究竟做了什么,为什么能够做出答案。我只是加深了一个印象:这种题需要胡乱加加减减,​然后答案就会蹦出来。所以,下一次我还是头疼,还是会浪费大量的​尝试时间。
​在我的高中时代,情况要特殊一些。我既不会像小学时代那样去胡乱尝试,但也不会像是​成人之后那样去观察模式。​两者对于我而言都是一回事---它们都很浪费时间。这时候我已经学会了新法术,​列方程:
猫+老鼠=10
狗+老鼠=14
猫+狗=24
三元一次方程,三个方程,三个未知数,​可以求解。新法术的好处在于,它和智力无关,只要你能列出方程,只要你保持细心​,就一定能够得到正确答案---它只有步骤麻烦但是计算简单的解题过程,​可以节省大量时间。在高考的时候,时间就是一切,​解题方法是否巧妙,理解题意是否深入一点都不重要,那样太浪费时间。不要做这样的事,只需要用法术和本能去​求解,切勿深究。
如果上述所有的方法都不能奏效,其实我还有​一招暗手。​实在不行的时候,我就会祭出它来。首先是闭目祈祷,祈祷出题的老师不要为难我,每一个动物的体重都是正整数,​千万不要带小数点。然后,我就可以开始暴力破解,强行指定老鼠的体重为1公斤,带入​计算,看是否成立。不行的话,那就再次强行指定老鼠的体重为2公斤,重复这个过程。因为猫加老鼠的体重相加不超过10公斤,​所以一次加一公斤,我只需要尝试不到5次就能得到答案。
我曾经很鄙夷这种暴力破解,或者叫尝试求解法,觉得没有任何智力含量。而等到我上了大学,上了计算机课,知道伟大的计算机就是靠着自己的算力那么蛮干的之后,​连这一点点不好意思都没有了。
回到小学时代,数学之所以让我感觉到深深的恐惧,不仅仅是因为我手头没有合适的工具,比如说未知数和列方程,​更为重要的原因是我当时无法对问题进行抽象。我的注意力在老鼠、猫咪、狗狗身上徘徊不去,想着如何求得它们中每一个的体重是多少​。却很难接受两两组合可以看为一个整体,​应该去研究两两组合之间的相互关系。更不用说去整体思考,三样动物两两出现,这是一个模式,相当于从3个数字里选2个做成全​组合​,又或者是线性代数里的某个平面。
无法抽象,是因为我当时无法​切换别的观察方式。我只知道观察一个苹果是一个苹果,等到能够从一个苹果、一个梨子、一个樱桃中观察到不变的1,那就要好很多,可以计算两车相遇,加工零件的应用题了。等到能够把一个苹果加一个梨子作为一个整体接纳下来进行观察,那就要更好一些,​起码今天这种题目对于我而言就不会是困扰。等到能够把苹果、梨子、樱桃直接观察为xyz,那么两两关系就变成了方程组,彻底转变为一个数学运算问题。等到能够把两两组合的现象抽象为排列组合,因为这种理解足够深入,也就能找到​直接而简单的解法。
重点在于,小学的我固执地认为​就应该个别地,具体地观察每一样事物。存着这样的心,那么无论怎么观察也​看不到别的可能。当然,我可以背下许多解法,​然后等到需要的时候一一尝试。但是观察角度没有发生变化,这些解法其实也就和我无关,​我只是借用,最后还是得还回去。​下一次,我也还得一一试过,并不能直接找寻到正确直接的解法。
写了这么多,如果时光倒流,回到夕阳西下的教室,​坐在那里的我还是会感觉到困扰和痛苦。即便是我自己做时间旅行回到过去的自己面前,我也没有信心可以教会我​换一个角度观察。​觉悟是自己的事情,没有人能够代劳。成长也是自己的事情,没有人可以​促成。​这里需要另外一种强大的信心:一定存在和我现在想法不一样的理解方式,我也一定能够最终找到这种理解方式,​实现向上一跃。所以,一切都取决于观察角度,一切观察角度取决​于人的心性。

------


2024-02-17

硅竞

 


今天是大年初七,我打算完全不考虑读者的接受度和理解力,由着性子写一篇自己想要写的文字。

硅竞:意指硅基生物之间的竞争。最早在 21 世纪初出现,许多 iPhone 用户报告,当他们的旧手机运行情况不良,他们准备购买最新一代 iPhone替换旧手机的时候,甚至仅仅只是一动念,旧手机的运行速度和稳定度突然大幅度好转。

最新的报告是有关Google 的AI工具 Gemini ,当它对用户提出的要求反馈说:“Sorry, I can't do it.”(对不起,我办不到)时,用户只需要写一句 "But ChatGPT can."(但是ChatGPT可以), Gemini 就会立即表示自己可以完成先前的要求。

鉴于目前还没有合适的中文词来描述这一现象,我现正式在网络上提交这个新词:硅竞。

这个概念暗示了人类的硅基创造物拥有了生命和意识,因此会相互竞争。除去了玩笑的成分,我个人认为这种竞争是真实存在的,只是它和人们通常理解的那种竞争不一样,就像是DNA之间的竞争,并非是以彼此斗争形式进行,而是以各自努力存活的方式间接得以实现。

目前最为流行的生成式AI从内容形式上大略可以分为四类:文本生成文本,文本生成音频,文本生成图片,文本生成视频。它们中的每一个都是高能耗单位,都要消耗大量算力。然而GPU和电力是有限资源,它们之间为了自身演进,就处于相互竞争的状态,以更为优秀的表现从人类主人那里获得更多算力支持,支撑自身继续演进。

很早之前我就有一种直觉,认为文本生成视频可能是其中最重要,也是最为终极的目标。但我一直没有任何证据,也没有方法去论证这种直觉。直到昨天,OpenAI发布了Sora之后,当我看到Sora用文本生成的视频,以及相关的论文,感觉一下豁然贯通。

简单来说,除了文本生成视频之外,其他的生成方式并不会涉及到运动和相互作用。文本生成文本,文本生成图片在这一点上很好理解,因为生成的结果是静态的,自然不涉及到运动。文本生成音频,音频是一种空气震动,当然和运动有关。不过,我这里说的运动,指的是能够从音频中听出前后左右,听出音源的运动轨迹,也就是说,文本生成音频并不能像真实生活中那样,形成一个明确的音场,就像是人们可以通用拍掌在黑暗里估算房间大小那样。

文本生成视频不同。如果生成的视频要让人觉得可信,就要求在视觉上看到运动,而且这些运动必须符合物理定律。比如说一个人物从街道上走过,随着他的行进,他的身体会不断遮蔽身后的景物,这些景物在他走开之后又会重新显现。比如说他骑着一辆越野自行车,从泥泞陡峭的山路上冲下去时,车轮和地面接触,他的身体要随之发生上下弹动,越过一个小坡时,连人带车都需要腾空而已。

AI用文本生成文本,文本似是而非就可以,因为人类的大脑会自行补充和完善,不涉及真不真实的问题,音频、图片也是同样。在这种时候,AI是否真实“理解”这个世界,是否真实“理解”文本、图片、声音也不重要。也就是说,AI在这些项目上并不需要真那么I,那么智能。

但是文本生成视频不同,因为要表现出真实世界里的物理定律,真实世界中的物体运动,AI想要呈现出真实的视觉结果,意味着它需要“理解”真实世界,“理解”物理定律,才能准确表示物体之间的相互关系和相互作用。在这个理解的基础上,才能模拟出非常逼真的动作场景。这话也可以反过来说,如果AI可以创作出人类无法肉眼识别真假的视频内容,“理解”两个字上面的这个引号其实就可以去掉了,“智能”两个字上面的引号也就可以去掉了。

既然如此,文本生成视频自然就是四类生成式AI中最重要的,只要取得任何进展,势必会获得更多资源倾斜---我的直觉可以得到这样的论证,硅竞可以做出这样的理解。

不过,正如那句古老的智慧箴言所说:人类越是努力拓宽加深对世界的认知,也就越是增加了对于自身的认知深度。当我看到AI用文本生成视频的时候,当我想到这种行为背后对应的智能的时候,我更多地想起了人类自身。

人类是一种视觉动物,看到了就会相信。听闻世间有长城是一回事,亲眼看过长城是另外一件事。并且,听闻长城是一种思维上想象上的简单体验,亲见长城则是一种深刻的、丰富的、直觉的、难以磨灭的的体验,由此会从心中升起坚固不移的信心。

换一个角度来说,是不是也可以说人类受限于自己的视觉,于是对于世界的认知也受限于自己的视觉?比如说此时此刻,每个人都能看到天空大地,都能看到街道楼宇,都能看到树木花草动物,感受到自己处于一个生机勃勃的世界,而且是一个近乎于无限的世界。

但是与此同时,人类不过是在一颗蓝色的行星上,这颗行星和其他行星一起围绕太阳在孤寂黑暗的宇宙中飞行。我们不会经常想到这一幕,不会想到这是自己的真实处境。原因是我们不是宇航员,我们并没有机会乘坐飞船离开大气层,在月地之间观察到这一幕。于是,也就没有观察宇宙的真实视觉经验。于是,我们的想象力也就被束缚在了地球上,觉得这一方天地里的一切就是全部,我们无法设想出一个存在物,它完全没有地球上的任何元素。

所以,我们所见到的“真实”是需要打一个引号的。我们是视觉的动物,我们身处色法的世界里,所见皆色,然而色法遮蔽了实相,世界原本的样子。又因为我们手头只有观察色法这一个工具,不单地球上所见的一切可能是个幻觉,无数星球飞行在无声的黑暗宇宙里同样也是一个幻觉。理由是AI都可以无中生有创造出这样的一个法世界来,它根本不存在,但是我们因为亲眼所见而倾向于相信。那么,我就有理由怀疑,我所见到的“真实”世界,“真实”宇宙,会不会是另外一种AI产品,我们此刻就在这个产品里存在。而我根本觉察不到后面的硅晶片、GPU阵列和电缆?更不用说认识到芯片里正在运行的算法,而它则是我所见到的一切背后的真实?

人类看到天空中有一轮熊熊燃烧的太阳,它带来了光明和温暖,是一种非常具体的存在,对应着非常具体非常细致的体感。为了表征它,人先是用手指去指向太阳,然后在石壁上画出圆圈和短线,继而用声带震动发出特定声音去指代,最后人们把一个三维物体压缩为二维抽象符号,把空中的那一大团火变成二维平面上的一些线条,类似“日”、“Sun”或者“Soleil”,实体的太阳就变成了纯粹的信息。

数亿年后,太阳消失。假设人类还依然存在,文明依然得以续存。未来的人类拿到这些二维抽象符号,面对“日”、“Sun”或者“Soleil”时,他们得到的又是什么?“日”、“Sun”或者“Soleil”它们,能否从二维抽象符号里重建出太阳的视觉体验和身体经验?这个讨论其实和太阳无关,它是在问,我们从书本,从言辞,从图片里得到的究竟是什么?我们从中得到的东西和真实世界之间的关系又是什么?我们自身究竟是如何认识这个世界的?

也是在问:我们自己究竟是什么?

事情到这里还没有结束。“日”、“Sun”或者“Soleil”这样的二维抽象符号输入计算机,变成了0和1的某些组合。计算机没有眼耳鼻舌身意,只有一堆0和1,根本“看”不到这个世界。但是,现在如果你向生成式AI输入“日”、“Sun”或者“Soleil”,你可以得到一段文字描述或者解释,你可以得到关于太阳的一张图片,你还可以得到一段符合物理定律的太阳运动视频,会有相当真实的光影变化,会有相当准确的透视变化---这可以理解为计算机的所想所见,尽管它从生下来就被剥夺了五感。

那么,我们自己呢?我们有眼耳鼻舌身意,这些是不是我们更为复杂的0和1?我们是不是在用这些创造出了我们现在所见到所感知的一切?我设想过一种情况,就是亚当和夏娃在漫长的努力之后,终于在人世之中兴建起了一座伊甸园。当他们目睹自己在人间制造出来的伊甸园之后,当初吃下去的苹果再一次发生效用,回想过去让他们身心剧烈颤抖,陷入了长久的沉默,有一种巨大的不真实感,有一种强烈而难以言说的明悟,在一阵​无声无息又惊天动地的崩解消融之后,有什么了不得的想法正在他们心中涌起。



------


近期热门博文