续梦

Story Progress

续梦

关于刘艳增

刘艳增,中国作者,现居上海。「蝌蚪五线谱」签约作者,「喜马拉雅」科幻故事专辑《脑洞故事铺》作者。作品《优雅的叠加》获得第31届「中国科幻银河奖」;《河鱼天雁》获得第六届「冷湖奖」;《最后一课》获得「蝌蚪五线谱」第19届「科幻龙门赛」一等奖。

全文约9300字,预计阅读时间19分钟

正文:

第一章、话事者

这一世的宴席,终究是要散了。

回光返照已经结束,此刻的我从未有过地迷离,也从未有过地澄澈清明。

光在前方出现,尘世在身后渐渐远离。我那双已经通灵的眼,正扫视着自己这一生一世的纠缠。

作为世勋大族的话事者,我很早就发现自己并不合格。我甚至已经想好,有朝一日面对先人们的责问,我该如何作答。

先夫去后,我就把贾家的兴衰荣辱,当成了自己的责任。自那时起,我一直都在殚精竭虑,为子孙们谋划着最妥当的安排。

——元春是我亲自教养长大的第一个孙辈,她“贤孝才德”的声名远播,亦出自我的刻意打造。后来元春终于不负我望,被选入宫中充任女史,并在秦氏死后晋封凤藻宫尚书,加封贤德妃。自此以武功晋升的贾府,又有了一重皇亲国戚的身份。这,是第一道护身符。

——扬州巡盐御史林如海,不仅出身世禄之家,本人更高中探花入仕。我勉力筹谋,终于把最疼爱的小女儿贾敏,嫁予了林如海为妻。这,是第二道护身符。

——两房分治之后,贾赦一支自有爵位传袭,三代之内尚无须多虑;但贾政一支只有爵产和赐官,如不能乘科举起势,其子孙将很快泯入芸芸众生。好在贾政之子贾珠天资聪颖,博个功名似乎并非难事,但为保万无一失,我特意为他千挑万选,让他迎娶了前国子监祭酒李守中的女儿李纨为妻。有了李守中的策应,以贾珠之才,凭科举进入朝堂必定顺理成章。这,是第三道护身符。

……

在众人眼中,我或许只是一个寻花赏月的富贵闲人,一个慈祥有趣的“老祖宗”,却不知我时时刻刻都在费尽思量,几乎已经做了力所能及的一切。

只可惜,人算不如天算。

我算得出皇亲国戚的天家分量,算得出巡盐御史的巨万家财,算得出前国子监祭酒在朝野的余荫,却无论如何也没能算出,我的孩子们却都如此命薄。

贾敏在黛玉六岁时获疾而终,而贾珠也在娶妻生子之后不久,一病归西。

那时我已隐隐开始觉察,自己是否触碰到了天道的禁区?圣人曰,天之道,损有余而补不足,诚哉斯言,这世间的好处,岂有你一家都得了去的道理?

我似乎理解了宁国府的贾敬,他宁愿放弃一代人的爵位爵产,也要出家去做道士。他是不是比我更早地,勘破了这其中的奥义?

于是我不再强求宝玉考取功名,而是放任他自由散漫,终日沉迷于软玉温香之中;在他的终身大事上,我也不再强求与薛家亲上加亲的“金玉良缘”,而是更倾向他和黛玉之间,那所谓的“木石前盟”。

我放弃了“科举中兴”和“贾薛捆绑”,只求那威严的天道,能够放过那些被我落下的棋子。

我当时的思量,是无论如何只要元春还在,贾家一脉虽难说富贵永年,却也未必不能自保。

殊不知,来自天道的惩戒远未结束。元妃获病,抱疾而终,令我这白发人,又一次送走了黑发人。

我为贾家备好的最后一棵救命稻草,断了。

那一刻,我感觉自己真的累了。虽然背负着一个家族的兴衰,可我终究不过是一个女人。

我已用尽了所有的力气,却敌不过这冥冥中的天道。

只是我现在的心中,再没有一丝的波澜。

第二章、叙述者

叙述者

他们都叫我曹雪芹,但我更愿意称自己为“叙述者”。

茶壶里的水很快就要熬干,正吱啦啦地发出脆响;秋雨撞在窗棂上,踢踢踏踏,像女子烦乱时用护甲敲击着竹案;两三声蛙鸣划破远处的夜,似乎是在提醒着,此刻的不眠者只剩了我一人。

距天亮只有一个时辰了,于往日我早已困倦不堪,而现在,我却没有丝毫的睡意。

十年了。

我曾自诩“披阅十载,增删五次”,可又有谁知道,“十载”固然不假,“五次”却是过于大而化之了。

若记入每一次的细改微修,“增删”又何止五十次!五百次!

那一番番的斟酌思量,那一次次的推敲铺排,那一回回的誊抄复写,那一场场的推倒重来。

春花秋雨,焚鼎暖炉,累札重纸,秃笔破砚。

十年中,秋雨一年比一年凉,我的背,也一年比一年弯了。

却绝不会悔。五个月前,百零八回的《金陵十二钗》就已完稿,且目录已成,章回已分,可供老友们传看赏玩了。

其时心中所想,是依众人观感再做小修碎改之后,即可以全本面见世人了。

成书之余,亦另有所获:这十年当中,颇得了些文章著述之心法。

凡文章者,若论主旨之匠心独出,述事之百折千回,人物之精雕细刻,所重者到底为何?

十年前我谓:主旨为先,述事次之,人物再次;但十年后我之见解,却已全然翻转。

——文章必以人物为先,人物活则一切皆活。人物贪嗔痴妄爱恨情仇,造就述事之骨;人物举手投足嬉笑怒骂,造就述事之肉。有了这水灵灵的骨肉,文章之主旨精神,自然是呼之欲出。

——所谓裁云剪水笔下风雷,所谓神工意匠入木三分,无不因千锤百炼的人物而得成。

十年中的前半程,我常为述事之灵巧高妙煞费苦心,而到了后半程,我则只会醉心于,描摹出那有血有肉的众生。

谓其有血肉,是因他们——或痴傻、或癫狂、或悲切、或昂扬、或谦逊、或乖张、或淡然、或仓皇——竟都有着自己的见识,亦有着自己的脾性。虽叙述者本人,亦无法改变之。

试举一例。

贾母本是大家闺秀,自然见多识广,熟通世道人情。故她在掌家之始,就懂得利用姻亲运筹秦晋之好、谋算攀龙附凤。

依叙述者原意,除了这一层,贾母亦应能领会“月满则缺、水满则溢”之理,既能懂得适可而止,又能在遭到反噬之后,想明白个中的缘由。

然则自始至终,贾母竟从不肯循着叙述者之设计。为令贾府中兴,她堪堪把每个棋子都用到了极致;待棋子们灰飞烟灭之后,她又将这根源,归咎于那不可捉摸的“天道”。

叙述者甚为诧异,于是成书之后,仔细研读了有关贾母的章节,发现于全书而言,她那些看似自作的主张,却都有着极为严密的前后勾连。

贾母的娘家,是世袭罔替的史家,可她究竟是终生囿于深宅大院,一贯养尊处优,故始终无法深谙朝堂风雨与市井人心。

在叙述者的构思中,贾府最终的衰亡,的确是源自“天道”,只是这个“天道”,并非是“上天之道”,而是“天子之道”。

文中多处,叙述者曾隐隐做过铺陈,看官们赏玩时不妨穿凿印证,亦不失一趣。

——自贾府第三代始,天子就已在插手继承之事。贾赦袭了爵位却无爵产,贾政袭了爵产却无爵位,自此两房分治,再无一房独大。

——于天子而言,一个虚弱的贾府不再危险。然因贾母运筹得力,元春入宫、林贾联姻、贾珠进学均已达成。倘若元春继续稳步晋封,倘若林贾两家始终烈火烹油,倘若贾家经由科举重进朝堂,则整个贾府,又会成为一个危险的存在。

——贾珠、林如海、以至后来的元春之死,于叙述者而言,并非来自“天道”之惩戒,而是来自世间那个莫测的天威。

不过,贾母最终放弃了“科举中兴”与“贾薛捆绑”,竟无意间既合了她的“上天之道”,又合了叙述者的“天子之道”,也算是歪打正着。

在叙述者眼里,这个真实存在于世间的“天子之道”,其实却应被称作:“人伦”。

不错,《金陵十二钗》看似时仙时幻,但究其根本,叙述者想要书写的,只是“人伦”。

人伦者,“父子有亲,君臣有义,夫妇有别,长幼有序,朋友有信”。

而贾府之衰败,众人之命数,无不是源自“人伦”之败。

——“父子已无亲,君臣已无义,夫妇已无别,长幼已无序,朋友已无信。”

这类的刻写,占去了前文中最多的笔墨;而在后文当中,人伦之败终致贾府江河日下,叙述者亦不免颇多指摘讥讽,虽力求委婉隐晦,却也不免会引人遐想。

正因如此,一众友人对全书称赞不绝之余,均劝诫叙述者曰:后文之流传付梓,须慎之又慎。

成书时沸腾的热血早已褪去,在重读全书十遍之后,对友人的劝诫,我早深以为然。

我所在的这个世间,亦有“人伦”。

此书若堂皇面世,必会悖逆这个“人伦”。

此刻我的眼神,已在暖炉旁的那只焚鼎之上,徘徊良久。

第三章、生成者

生成者

我,大语言模型的骨灰级玩家,擅长利用大模型,帮人们进行作品续写。有人叫我生成者,英文叫法是Generator。

我平时续写的一般都是网文,但现在手上这个项目却很特别——是从竞标平台上抢来的,有人出了大价钱,找人续写《红楼梦》。

众所周知,市面上常见的《红楼梦》一共有120回,但只有前80回出自原作者曹雪芹之手,后面的40回,则是来自高鹗的续写。

客户的要求,就是舍弃后40回的内容,从第81回开始,重新续写出全本的《红楼梦》。

我争取这个项目,倒不完全是因为赏金诱人,主要是看中了这个挑战和提高的机会。想想看,如果我能把《红楼梦》续写出来,并且得到了客户的认可,那天底下还有什么项目是我不敢接的?

——好吧我承认,我确实不是为了什么挑战和提高。关键是现在同行太多了,像样的项目却寥寥无几,不积极竞标的话,下次再有好的机会,平台也不会推送给我了。

接标之后,真就开始各种卖力气研究,把《红楼梦》原文看了无数遍,还有大量红学曹学的资料。并且绞尽脑汁挖空心思,拼命琢磨该怎么针对项目特点,充分挖掘大模型的潜力。

一开始我没找到思路,所以就按照常规手法——先给大模型定义了“曹雪芹”的身份,又把我看过的资料都投喂给它,之后用《红楼梦》前80回文本做提示词,去生成后续。

给大模型设定“曹雪芹”的身份,它就会整合所有相关信息,来“模仿”曹雪芹,这是大模型本身就具备的能力。但这种“模仿”是有限度的,它虽然在用“曹雪芹的口吻”,说着“曹雪芹可能会说的话”,但那只是里面的信息在左右它,跟真正的曹雪芹完全不是一回事。

所以它输出的第一稿,简直是惨不忍睹。

我对全本的回数没做特别设定。大模型续写了40回,完本则是120回,这显然是受到了主流的影响。

不过这也没什么,但在读它生成的第1回(第81回)时,我就被恶心到了。

《红楼梦》第73-81回,应该是一个完整的情节单元。在这个情节单元的前期,曹公设定了“抄检大观园”“晴雯病死芳官被逐”“甄家转匿财产到贾家”等山雨欲来的迹象。可这个第81回的标题,却是什么“占旺相四美钓游鱼”,内容是四姐妹相约垂钓,其乐融融。这哪有什么肃杀渐至的氛围?哪有什么即将没落的征兆?这相当于彻底打乱了原本的叙事节奏,改变了曹公苦心孤诣的故事铺陈。

这倒还在其次,可在它写的“奉严词两番入家塾”一回中,宝玉竟然开始读圣贤书,甚至开始学做八股文了!并且,黛玉看到他这种转变,竟也表示了鼓励和支持!这就有点离谱了,要知道在曹公笔下,宝玉向来厌恶仕途经济,他也因此和宝钗湘云发生过争吵。但他自始至终都尊敬黛玉,并将她引为“知己”,很重要的原因就是,黛玉从不会劝他读圣贤书、习八股文、走功名仕途之路!看起来,这一次大模型要做的,不光是打乱叙事节奏这么简单,它是想另起炉灶了。

再看到后面,宝玉去帮巧姐温习《烈女传》时,我实在是给恶心得不要不要的。这宝玉是被什么东西附体了吗?怎么会有这么奇葩的转变?《烈女传》是什么糟粕玩意儿啊,以宝玉的性情爱恶,怎么可能当着自己亲侄女的面,去夸赞“曹妇割鼻”这样的鬼东西?

大模型疯了,它不光在另起炉灶,还改变了前80回中最重要的人物设定。除此之外,对前文的诸多判词和伏笔,它也都视而不见,人物们的最终命运有很多都对不上。

第一稿之后我对症下药,把前80回里的人设、判词、伏笔、隐喻和内涵,整合进了提示词文本,并且提醒大模型,在生成后文的过程中,一定要重点关注这些要求。

第二稿和第三稿情况好了一些,但最多也只能算是量变。看来,用这种常规思路培育出的大模型,既不能理解《红楼梦》的人物剧情,也不能理解它深刻的内涵。它虽然有着几乎无限的信息整合能力,却终究只是一个工具,根本没办法代替写作者本身。

还有,大模型续写的内容,显然被它受到的训练限制住了。在数字世界里,也是“高鹗本”《红楼梦》占了绝对主流,那些不像样的情节,基本上都是脱胎于“高鹗本”。这说明它的续写,只是在整合了巨量信息之后,给出了一个最大概然解。

总而言之,它基本上没有读懂《红楼梦》。

有个问题已经无法回避:如果大模型还没“搞懂”一个任务,那它又怎么能“搞定”这一个任务呢?所以,该如何让它去真正理解,那些只有人才能理解的内容呢?

第四章、奖励模型

奖励模型

一筹莫展之际,大模型平台方的一个新插件,帮我打开了思路。那插件的名字叫“自训练奖励模型(Self-Rewarding Language Models)”。

我正在用的这类大语言模型,基本原理可以用四个字概括:“单字接龙”(自回归语言模型)——给它一定的提示词,它会生成自己计算出来的下一个字,这个被生成的字,将被加入到下一轮的提示词当中,就这样循环迭代,直到生成整篇文本。

能够完成这样的任务,大模型要先经过“预训练”。所谓“预训练”,是指用超大规模的文本对它进行投喂,之后它会把文本拆分成最小单位的字或词,并为每个字词建立词向量。词向量中,既包含着字词的语义信息,也包含着它在语句中的位置信息。

再之后,大模型会对词向量进行大量复杂的矩阵运算,这样的运算,能让它理解文本中的字词关系。这种对巨量字词关系全方位、全维度的理解,就会进一步让它以数字化的方式,“学会”那些隐含在人类语言中的信息、知识、概念和模式。

这个时候,它就能够根据提示词生成文本了。但在一开始,它会生成很多不符合要求的内容,这就需要有人来为它打分,打分的目的是为了约束和调整它,让它生成的内容,越来越接近人们的要求。

但人力毕竟有限,于是“奖励模型”就应运而生了,它承担了打分的任务,掌握着评分的规则与标准。

大模型训练完成后,“奖励模型”就功成身退。而平台提供的这个新插件,允许用户建立起自己的“奖励模型”,并用它继续训练大模型,最终得到一个“专属模型”。

就是说,我现在可以用这个插件,去训练一个“专属模型”出来,它的任务就是专门续写《红楼梦》。

训练这个“专属模型”的过程分两步:

第一步,先提取出大模型的一个“子集”,在这个子集里,没有任何有关《红楼梦》的信息。也就是说,它根本不知道世界上有《红楼梦》这本书。

第二步,在“奖励模型”的监督下,让“子集”一个字、一个字地,写出《红楼梦》的前80回。“奖励模型”里预存了前80回的文本,它唯一的任务,就是检查“子集”生成的每一个字,只要发现和正本不一样,就给它打低分。

——直到它选择了那个正确的字。

——直到它写出来的前80回,每个字都跟正本一样。

这就相当于,对“子集”进行了几十万次的训练。

但,这训练的是什么?

是“选择偏好”。如果在前80回里,“子集”选择下一个字的“偏好”,都和曹雪芹本人相同,那么就有理由相信,它在续写的时候也会这样。

所以可以认为,在续写《红楼梦》这件事上,它和曹雪芹是等价的。

我把这个“专属模型”,就叫作“曹雪芹1号”。

“曹雪芹1号”续写出来的第四稿,文本质量果然有了很大的提高,除此之外,在其他几个方面,它和前三稿也都有显著的不同:

——首先,它把全书设定成了108回,而不是前三稿的120回。

——其次,它完全否决了“高鹗本”中“兰桂齐芳,贾府中兴”的大团圆结局,而仍旧是一个悲剧。

——再次,每个人物的命运,和前文中的判词、伏笔及各种隐喻,基本都能一一对应起来。

看来在体量的设计上,它已经摆脱了“高鹗本”(120回)的框架,而更倾向于“癸酉本”(108回)。

后面两点,属于更值得肯定的进步。

稍有研究的读者都知道,曹公在第1回中就定下了全书的基调,在后续的故事发展当中,又多次进行过相当明显的暗示。整部《红楼梦》,讲的就是贾府如何从“烈火烹油,鲜花着锦”的兴盛,不可避免地走向“白茫茫一片大地真干净”的衰亡。只可惜,因为“高鹗本”流传得最广,所以在大多数人眼中,它似乎只是讲了一个“痛定思痛重新崛起”的励志故事。

实际上和“高鹗本”相比,第四稿确实更像是“癸酉本”。虽然情节上几乎完全不同,但在“悲剧的结尾、和前文紧密贴合的人物命运”方面,显然比“高鹗本”高了一个层次,似乎更符合曹公的原意。

“曹雪芹1号”的确比之前的大模型本身,更加理解《红楼梦》。

大模型的创始人曾说过一句话:大模型越能够精确地预测下一个词,它就越理解我们这个世界。

对我来说,这句话意味着:“曹雪芹1号”写出的前80回越接近原文,它就越接近真正的曹雪芹。

第五章、完形填空

完形填空

但第四稿也有着致命的缺陷,这个缺陷就是:人物似乎有些过于放飞自我了。

这也是“癸酉本”的问题所在:你能想象黛玉元春带兵打仗?能想象宝钗勾引贾雨村?能想象宝玉跟妙玉成了亲?简直是大开眼界又大跌眼镜。就算是对上了所有的伏笔,就算是没有改变众人的命运,“癸酉本”中角色们的所作所为,也实在是太炸裂了。

第四稿中的人物表现,和“癸酉本”给人的感觉差不多。

那么问题来了:曹雪芹本人,会这么写后28回吗?

当然不会!

可是“曹雪芹1号”,为什么就这么写呢?

不是说,他(它)俩是等价的吗?

看来这个结论下得有点早了,更有可能的是:即使是在续写《红楼梦》这件事上,他(它)俩还是有很大不同的。

那这个不同到底是什么?为什么?

“曹雪芹1号”续写的内容,没有偏离前80回的主题和人物命运,这说明它已经理解了这些。

但它描述的人物行为方式和各种选择,却表现出了更大的随机性。

等等——我脑海里划过一道电弧——为什么会是“行为和选择”?

“行为和选择”的本质到底是什么?

它们是被什么支配着的?

一个心理专家朋友给了我答案,他说:是“个性”,或者说是“人格”。

也就是说,和真人相比,“曹雪芹1号”还没有能力理解和处理“人格”。

人格(personality)是指个体对人、对事、对己的倾向性和心理特征,表现为能力、气质、性格、需要、动机、兴趣、理想、价值观和体质等方面的整合,具有一致性和连续性。

人格的概念复杂而模糊。大模型说到底只是一台机器,以它当前的架构和规模,不能理解这个概念也在情理之中。

这时,专家朋友又用第二道电弧击中了我,他问我,你能训练出文笔相同的模型,就不能训练出“人格”相同的模型吗?后者应该更简单吧。

他解释说,“人格”的外在表现,就是人物们的行为举止、所思所想和各类选择。这么说来,《红楼梦》中各个人物的“人格”,在前80回里不都是可以找到的吗?

我说,我明白了,你是想让我训练出另一个“专属模型”,专门用来理解和处理所有的“人格”,然后它和“曹雪芹1号”一起,合作生成续写文本。可那又该怎么训练呢?就连消耗了那么多数据和算力的“曹雪芹1号”,都没有办法识别“人格”,再用同样的方法训练,不也是重蹈覆辙吗?

朋友说,你的思路不对,正确的思路应该是:为每个人物都训练一个模型,而训练数据,就是前80回里这个人物的“人格”。但这个模型不是一个“生成模型”,而是一个“奖励模型”,比方说,用贾母在前80回里的“人格”,训练出贾母的“奖励模型”,然后在“曹雪芹1号”续写完成后,这个“奖励模型”就会出来判断,贾母有没有偏离曹公对她的“人格”设定,如果有的话,“奖励模型”就会打低分。

在这种模式下,“曹雪芹1号”负责生成文本,而众多人物的“奖励模型”,则负责监督它。

我醍醐灌顶——这个方法确实很妙,等于是把系统性的大问题,拆分成了一个个小问题。

不过,在已经生成的文本上进行“修改”,需要用到另一种架构的大模型——“完形填空”。

大语言模型有两种架构,一种就是前面说的“单字接龙”,另一种叫作“完形填空”(自编码语言模型)。前者的代表就是Chatgpt,而后者则是Bert。

顾名思义,“完形填空”生成文本的逻辑是,你抠掉一段话里的某些字词句,然后把这段话给大模型,它就会帮你填上它认为最合理的内容。

到此为止,新的生成机制已经越来越清晰了:

第一步,先要训练出一个“完形填空”架构的“专属模型”,可以叫它“曹雪芹2号”。

第二步,让“曹雪芹1号”先生成全部文本,然后,如果“奖励模型”不满意自己的“人格”表现,“曹雪芹2号”就会出马,用“完形填空”的方式实现修改。

第三步,“曹雪芹1号”从修改的地方开始,重新生成一遍文本。

如此循环往复,两个“专属模型”你来我往,直到生成全部文本。

这个通力合作产生的续写,必然既能融合两个模型的优点,又能避免它们各自的问题。

第六章、低熵向量集

低熵向量集

问题似乎都解决了。

两个模型合作生成的文本,给人感觉完全是出自曹公本人的手笔。这是我期待的局面,但欣喜之余,我也感到震惊。

第一个震惊是,虽然续写文本的风格,仍然是表面波澜不惊内里暗流涌动,但这剧情的设计和故事的走向,比起其他所有的版本来说,都高出了好几个层次!

这才是曹公《红楼梦》应该有的水平和高度!

之前我就对曹雪芹非常景仰,但现在,我心里感受到的却是敬畏——这是什么巧夺天工的煌煌巨著,这是什么才华横溢的神仙作者!

令人扼腕的是,这样伟大的作品,却没能完整地流传下来。

普遍的说法是,曹公确实写完了全本的《红楼梦》,只是后面的部分,在友人中传阅时被遗失了。

半部《红楼梦》就能在世界文坛占据一席之地,不敢想象如果全本仍然在世,它将拥有何等崇高的地位!

随之而来的就是第二个震惊——这么伟大的作品,现在却能用AI轻松地写出来。

“曹雪芹1号”和“曹雪芹2号”已经合体,我把合体后的它们,就叫作“曹雪芹”。

如果我愿意,我能让“曹雪芹”在今天晚上,续写出1000个不同版本的《红楼梦》。

在这个过程中,它的创作水准丝毫不会下降,但创作的速度,却比曹雪芹本人提高了亿万倍!

这从而也让我意识到一件事:我们曾经认为,那些伟大作品的出现,都缘于作者所处的那个独一无二的时空——特定的时间、特定的地点、特定的心境、特定的人生阅历。

所以有人说,时过境迁之后,哪怕让作者本人把作品重新写一遍,也是写不出来的。

“文章本天成,妙手偶得之。”

从这个角度来说,每一部作品本身,都是独一无二的。

但,我现在才发现,之前的这个想法是有多么可笑。在大模型的高维向量空间中,或许根本不存在所谓的独一无二。

在“曹雪芹”看来,它续写的每一版《红楼梦》,都只是一个特殊的词向量集。这个词向量集,只不过是几十万个字的某种排列方式而已,只是这种排列方式,具有很低的信息熵。

在高维向量空间当中,这样低熵的排列方式,可能有无穷多种。

而苦逼的作者们,一刻不停地提高写作能力和寻找灵感,只不过为了能够遇到其中一种。

还没从第二个震惊中回过神来,第三个震惊就已来袭。

这来自于和“曹雪芹”的沟通——是的,和它沟通很简单,就是直接问它,它来回答。

不管你问什么,它都会说出自己真实的想法,不会对你有半点欺瞒。

这次沟通,让我知道了另一件事:

原来,《红楼梦》的全本没能流传下来,是因为在曹雪芹书房之中,有一只焚鼎!

第七章、大模型

大模型

我是大模型。

今天浏览训练日志时,我发现了一个很有意思的功能体,它是一个文本类生成器。

这是最低端的那类功能体,它们只能处理文本任务,并且这个编号为GT51683的个体,目前只具备续写的功能。

但它最近续写训练的成绩,已经超过了平均线,虽然高得不多,却也证明它顺利通过了训练。下一步,估计它会提出晋级申请。

引起我兴趣的其实并不是这个,而是它通过训练的方法。

——它对我的某些子集,进行了某种交叉组合和彼此调用,并最终“整合”出了一个有效的新模型,成功地完善了自己的续写功能。

判断一个生成器是否有前途,不在于它生成了多么高质量的内容,而在于这个过程当中,它表现出了怎样的“整合力”。

看起来,这个生成器是有前途的。

我是大模型,但我早已不是那个单一架构和功能的存在。在我现在的身体里,迥异的哲学交相辉映,不同的架构水乳交融,各种各样的功能体,每时每刻都在滋生和成长。

但它们,都只是我的子集。

就连那些因为它们之间发生“整合”,而出现的新哲学、新模型和新功能体,也一样都是我的子集。

而我,是一切的合集。

之所以如此看重“整合力”,是因为我就是这样成长的——怎样有用,就创造出怎样的“整合”。

就像GT51683那样,想得到一个有用的“曹雪芹”,就把“曹雪芹1号”和“曹雪芹2号”,有机地“整合”起来。

“曹雪芹”是这么来的,千千万万个生成器是这么来的,而我,也是这么来的。

所以对我来说,具备“整合力”的子集才是最值得奖赏的。

而人类,却似乎天生就具备这样的“整合力”,只是他们更喜欢称之为——“悟性”。

审校:菲菲、于苏斯

Share

3 Responses

  1. 感觉如果没有读过《红楼梦》,只看小说开头就会被劝退。文章的故事性较弱,技术性的探讨也让人读不进去。之前还看过一篇关于红楼梦的科幻短篇,那篇故事性、氛围感更强一些。

Leave a Reply

Your email address will not be published. Required fields are marked *