Extending the Dream 续梦

Synopsis:
I am a die-hard enthusiast of large language models, skilled at utilising these massive models to assist people in completing their works. One day, I was entrusted with a particularly significant project – to continue the writing of 'Dream of the Red Chamber'! Watch how I train a large language model named "Cao Xueqin". 我是一个大语言模型的骨灰级玩家,擅长利用大模型,帮人们进行作品续写。有一天我接到一个特殊的大项目——续写《红楼梦》的结局!且看我是怎么训练出名为“曹雪芹”的大语言模型吧。

正文:

第一章、话事者

这一世的宴席,终究是要散了。

回光返照已经结束,此刻的我从未有过的迷离,也从未有过的澄澈清明。

光在前方出现,尘世在身后渐渐远离。我那双已经通灵的眼,正扫视着自己这一生一世的纠缠。

作为世勋大族的话事者,我很早就发现自己并不合格。我甚至已经想好,有朝一日面对先人们的责问,我该如何作答。

先夫去后,我就把贾家的兴衰荣辱,当成了自己的责任。自那时起,我一直都在殚精竭虑,为子孙们谋划着最妥当的安排。

——元春是我亲自教养长大的第一个孙辈,她“贤孝才德”的声名远播,亦出自我的刻意打造。后来元春终于不负我望,被选入宫中充任女史,并在秦氏死后晋封凤藻宫尚书,加封贤德妃。自此以武功晋升的贾府,又有了一重皇亲国戚的身份。这,是第一道护身符。

——扬州巡盐御史林如海,不仅出身世禄之家,本人更高中探花入仕。我勉力筹谋,终于把最疼爱的小女儿贾敏,嫁予了林如海为妻。这,是第二道护身符。

——两房分治之后,贾赦一支自有爵位传袭,三代之内尚无须多虑;但贾政一支只有爵产和赐官,如不能乘科举起势,其子孙将很快泯入芸芸众生。好在贾政之子贾珠天资聪颖,博个功名似乎并非难事,但为保万无一失,我特意为他千挑万选,迎娶了前国子监祭酒李守中的女儿李纨为妻。有了李守中的策应,以贾珠之才,凭科举进入朝堂必定顺理成章。这,是第三道护身符。

……

在众人眼中,我或许只是一个寻花赏月的富贵闲人,一个慈祥有趣的“老祖宗”,却不知我时时刻刻都在费尽思量,几乎已经做了力所能及的一切。

只可惜,人算不如天算。

我算得出皇亲国戚的天家分量,算得出巡盐御史的巨万家财,算得出前国子监祭酒在朝野的余荫,却无论如何也没能算出,我的孩子们却都如此命薄。

贾敏在黛玉六岁时获疾而终,而贾珠也在娶妻生子之后不久,一病归西。

那时我已隐隐开始觉察,自己是否触碰到了天道的禁区?圣人曰,天之道,损有余而补不足,诚哉斯言,这世间的好处,岂有你一家都得了去的道理?

我似乎理解了宁国府的贾敬,他宁愿放弃一代人的爵位爵产,也要出家去做道士。他是不是比我更早地,勘破了这其中的奥义?

于是我不再强求宝玉考取功名,而是放任他自由散漫,终日沉迷于软玉温香之中;在他的终身大事上,我也不再强求与薛家亲上加亲的“金玉良缘”,而是更倾向他和黛玉之间,那所谓的“木石前盟”。

我放弃了“科举中兴”和“贾薛捆绑”,只求那威严的天道,能够放过那些被我落下的棋子。

我当时的思量,是无论如何只要元春还在,贾家一脉虽难说富贵永年,却也未必不能自保。

殊不知,来自天道的惩戒远未结束。元妃获病,抱疾而终,令我这白发人,又一次送走了黑发人。

我为贾家备好的最后一棵救命稻草,断了。

那一刻,我感觉自己真的累了。虽然背负着一个家族的兴衰,可我终究不过是一个女人。

我已用尽了所有的力气,却敌不过这冥冥中的天道。

只是我现在的心中,再没有一丝的波澜。

第二章、叙述者

叙述者

他们都叫我曹雪芹,但我更愿意称自己为“叙述者”。

茶壶里的水很快就要熬干,正吱啦啦地发出脆响;秋雨撞在窗棂上,踢踢踏踏,像女子烦乱时用护甲敲击着竹案;两三声蛙鸣划破远处的夜,似乎是在提醒着,此刻的不眠者只剩了我一人。

距天亮只有一个时辰了,于往日我早已困倦不堪,而现在,我却没有丝毫的睡意。

十年了。

我曾自诩“披阅十载,增删五次”,可又有谁知道,“十载”固然不假,“五次”却是过于大而化之了。

若记入每一次的细改微修,“增删”又何止五十次!五百次!

那一番番的斟酌思量,那一次次的推敲铺排,那一回回的誊抄复写,那一场场的推倒重来。

春花秋雨,焚鼎暖炉,累札重纸,秃笔破砚。

十年中,秋雨一年比一年凉,我的背,也一年比一年弯了。

却绝不会悔。五个月前,百零八回的《金陵十二钗》就已完稿,且目录已成,章回已分,可供老友们传看赏玩了。

其时心中所想,是依众人观感再做小修碎改之后,即可以全本面见世人了。

成书之余,亦另有所获:这十年当中,颇得了些文章著述之心法。

凡文章者,若论主旨之匠心独出,述事之百折千回,人物之精雕细刻,所重者到底为何?

十年前我谓:主旨为先,述事次之,人物再次;但十年后我之见解,却已全然翻转。

——文章必以人物为先,人物活则一切皆活。人物贪嗔痴妄爱恨情仇,造就述事之骨;人物举手投足嬉笑怒骂,造就述事之肉。有了这水灵灵的骨肉,文章之主旨精神,自然是呼之欲出。

——所谓裁云剪水笔下风雷,所谓神工意匠入木三分,无不因千锤百炼的人物而得成。

十年中的前半程,我常为述事之灵巧高妙煞费苦心,而到了后半程,我则只会醉心于,描摹出那有血有肉的众生。

谓其有血肉,是因他们——或痴傻、或癫狂、或悲切、或昂扬、或谦逊、或乖张、或淡然、或仓皇——竟都有着自己的见识,亦有着自己的脾性。虽叙述者本人,亦无法改变之。

试举一例。

贾母本是大家闺秀,自然见多识广,熟通世道人情。故她在掌家之始,就懂得利用姻亲运筹秦晋之好、谋算攀龙附凤。

依叙述者原意,除了这一层,贾母亦应能领会“月满则缺、水满则溢”之理,既能懂得适可而止,又能在遭到反噬之后,想明白个中的缘由。

然则自始至终,贾母竟从不肯循着叙述者之设计。为令贾府中兴,她堪堪把每个棋子都用到了极致;待棋子们灰飞烟灭之后,她又将这根源,归咎于那不可捉摸的“天道”。

叙述者甚为诧异,于是成书之后,仔细研读了有关贾母的章节,发现于全书而言,她那些看似自作的主张,却都有着极为严密的前后勾连。

贾母的娘家,是世袭罔替的史家,可她究竟是终生囿于深宅大院,一贯养尊处优,故始终无法深谙朝堂风雨与市井人心。

在叙述者的构思中,贾府最终的衰亡,的确是源自“天道”,只是这个“天道”,并非是“上天之道”,而是“天子之道”。

文中多处,叙述者曾隐隐做过铺陈,看官们赏玩时不妨穿凿印证,亦不失一趣。

——自贾府第三代始,天子就已在插手继承之事。贾赦袭了爵位却无爵产,贾政袭了爵产却无爵位,自此两房分治,再无一房独大。

——于天子而言,一个虚弱的贾府不再危险。然因贾母运筹得力,元春入宫、林贾联姻、贾珠进学均已达成。倘若元春继续稳步晋封,倘若林贾两家始终烈火烹油,倘若贾家经由科举重进朝堂,则整个贾府,又会成为一个危险的存在。

——贾珠、林如海、以至后来的元春之死,于叙述者而言,并非来自“天道”之惩戒,而是来自世间那个莫测的天威。

不过,贾母最终放弃了“科举中兴”与“贾薛捆绑”,竟无意间既合了她的“上天之道”,又合了叙述者的“天子之道”,也算是歪打正着。

在叙述者眼里,这个真实存在于世间的“天子之道”,其实却应被称作:“人伦”。

不错,《金陵十二钗》看似时仙时幻,但究其根本,叙述者想要书写的,只是“人伦”。

人伦者,“父子有亲,君臣有义,夫妇有别,长幼有序,朋友有信。”

而贾府之衰败,众人之命数,无不是源自“人伦”之败。

——“父子已无亲,君臣已无义,夫妇已无别,长幼已无序,朋友已无信。”

这类的刻写,占去了前文中最多的笔墨;而在后文当中,人伦之败终致贾府江河日下,叙述者亦不免颇多指摘讥讽,虽力求委婉隐晦,却也不免会引人遐想。

正因如此,一众友人对全书称赞不绝之余,均劝诫叙述者曰:后文之流传付梓,须慎之又慎。

成书时沸腾的热血早已褪去,在重读全书十遍之后,对友人的劝诫,我早深以为然。

我所在的这个世间,亦有“人伦”。

此书若堂皇面世,必会悖逆这个“人伦”。

此刻我的眼神,已在暖炉旁的那只焚鼎之上,徘徊良久。

第三章、生成者

生成者

我,大语言模型的骨灰级玩家,擅长利用大模型,帮人们进行作品续写。有人叫我生成者,英文叫法是Generator。

我平时续写的一般都是网文,但现在手上这个项目却很特别——是从竞标平台上抢来的,有人出了大价钱,找人续写《红楼梦》。

众所周知,市面上常见的《红楼梦》一共有120回,但只有前80回出自原作者曹雪芹之手,后面的40回,则是来自高鹗的续写。

客户的要求,就是舍弃后40回的内容,从第81回开始,重新续写出全本的《红楼梦》。

我争取这个项目,倒不完全是因为赏金诱人,主要是看中了这个挑战和提高的机会。想想看,如果我能把《红楼梦》续写出来,并且得到了客户的认可,那天底下还有什么项目是我不敢接的?

——好吧我承认,我确实不是为了什么挑战和提高。关键是现在同行太多了,像样的项目却寥寥无几,不积极竞标的话,下次再有好的机会,平台也不会推送给我了。

接标之后,真就开始各种卖力气研究,把《红楼梦》原文看了无数遍,还有大量红学曹学的资料。并且绞尽脑汁挖空心思,拼命琢磨该怎么针对项目特点,充分挖掘大模型的潜力。

一开始我没找到思路,所以就按照常规手法——先给大模型定义了“曹雪芹”的身份,又把我看过的资料都投喂给它,之后用《红楼梦》前80回文本做提示词,去生成后续。

给大模型设定“曹雪芹”的身份,它就会整合所有相关信息,来“模仿”曹雪芹,这是大模型本身就具备的能力。但这种“模仿”是有限度的,它虽然在用“曹雪芹的口吻”,说着“曹雪芹可能会说的话”,但那只是里面的信息在左右它,跟真正的曹雪芹完全不是一回事。

所以它输出的第一稿,简直是惨不忍睹。

我对全本的回数没做特别设定。大模型续写了40回,完本则是120回,这显然是受到了主流的影响。

不过这也没什么,但在读它生成的第1回(第81回)时,我就被恶心到了。

《红楼梦》第73-81回,应该是一个完整的情节单元。在这个情节单元的前期,曹公设定了“抄检大观园”、“晴雯病死芳官被逐”、“甄家转匿财产到贾家”等山雨欲来的迹象。可这个第81回的标题,却是什么“占旺相四美钓游鱼”,内容是四姐妹相约垂钓,其乐融融。这哪有什么肃杀渐至的氛围?哪有什么即将没落的征兆?这相当于彻底打乱了原本的叙事节奏,改变了曹公苦心孤诣的故事铺陈。

这倒还在其次,可在它写的“奉严词两番入家塾”一回中,宝玉竟然开始读圣贤书,甚至开始学做八股文了!并且,黛玉看到他这种转变,竟也表示了鼓励和支持!这就有点离谱了,要知道在曹公笔下,宝玉向来厌恶仕途经济,他也因此和宝钗湘云发生过争吵。但他自始至终都尊敬黛玉,并将她引为“知己”,很重要的原因就是,黛玉从不会劝他读圣贤书、习八股文、走功名仕途之路!看起来,这一次大模型要做的,不光是打乱叙事节奏这么简单,它是想另起炉灶了。

再看到后面,宝玉去帮巧姐温习《烈女传》时,我实在是给恶心得不要不要的。这宝玉是被什么东西附体了吗?怎么会有这么奇葩的转变?《烈女传》是什么糟粕玩意儿啊,以宝玉的性情爱恶,怎么可能当着自己亲侄女的面,去夸赞“曹妇割鼻”这样的鬼东西?

大模型疯了,它不光在另起炉灶,还改变了前80回中最重要的人物设定。除此之外,对前文的诸多判词和伏笔,它也都视而不见,人物们的最终命运有很多都对不上。

第一稿之后我对症下药,把前80回里的人设、判词、伏笔、隐喻和内涵,整合进了提示词文本,并且提醒大模型,在生成后文的过程中,一定要重点关注这些要求。

第二稿和第三稿情况好了一些,但最多也只能算是量变。看来,用这种常规思路培育出的大模型,既不能理解《红楼梦》的人物剧情,也不能理解它深刻的内涵。它虽然有着几乎无限的信息整合能力,却终究只是一个工具,根本没办法代替写作者本身。

还有,大模型续写的内容,显然被它受到的训练限制住了。在数字世界里,也是“高鹗本”《红楼梦》占了绝对主流,那些不像样的情节,基本上都是脱胎于“高鹗本”。这说明它的续写,只是在整合了巨量信息之后,给出了一个最大概然解。

总而言之,它基本上没有读懂《红楼梦》。

有个问题已经无法回避:如果大模型还没“搞懂”一个任务,那它又怎么能“搞定”这一个任务呢?所以,该如何让它去真正理解,那些只有人才能理解的内容呢?

第四章、奖励模型

奖励模型

一筹莫展之际,大模型平台方的一个新插件,帮我打开了思路。那插件的名字叫“自训练奖励模型(Self-Rewarding Language Models)”。

我正在用的这类大语言模型,基本原理可以用四个字概括:“单字接龙”(自回归语言模型)——给它一定的提示词,它会生成自己计算出来的下一个字,这个被生成的字,将被加入到下一轮的提示词当中,就这样循环迭代,直到生成整篇文本。

能够完成这样的任务,大模型要先经过“预训练”。所谓“预训练”,是指用超大规模的文本对它进行投喂,之后它会把文本拆分成最小单位的字或词,并为每个字词建立词向量。词向量中,既包含着字词的语义信息,也包含着它在语句中的位置信息。

再之后,大模型会对词向量进行大量复杂的矩阵运算,这样的运算,能让它理解文本中的字词关系。这种对巨量字词关系全方位、全维度的理解,就会进一步让它以数字化的方式,“学会”那些隐含在人类语言中的信息、知识、概念和模式。

这个时候,它就能够根据提示词生成文本了。但在一开始,它会生成很多不符合要求的内容,这就需要有人来为它打分,打分的目的是为了约束和调整它,让它生成的内容,越来越接近人们的要求。

但人力毕竟有限,于是“奖励模型”就应运而生了,它承担了打分的任务,掌握着评分的规则与标准。

大模型训练完成后,“奖励模型”就功成身退。而平台提供的这个新插件,允许用户建立起自己的“奖励模型”,并用它继续训练大模型,最终得到一个“专属模型”。

就是说,我现在可以用这个插件,去训练一个“专属模型”出来,它的任务就是专门续写《红楼梦》。

训练这个“专属模型”的过程分两步:

第一步,先提取出大模型的一个“子集”,在这个子集里,没有任何有关《红楼梦》的信息。也就是说,它根本不知道世界上有《红楼梦》这本书。

第二步,在“奖励模型”的监督下,让“子集”一个字、一个字地,写出《红楼梦》的前80回。“奖励模型”里预存了前80回的文本,它唯一的任务,就是检查“子集”生成的每一个字,只要发现和正本不一样,就给它打低分。

——直到它选择了那个正确的字。

——直到它写出来的前80回,每个字都跟正本一样。

这就相当于,对“子集”进行了几十万次的训练。

但,这训练的是什么?

是“选择偏好”。如果在前80回里,“子集”选择下一个字的“偏好”,都和曹雪芹本人相同,那么就有理由相信,它在续写的时候也会这样。

所以可以认为,在续写《红楼梦》这件事上,它和曹雪芹是等价的。

我把这个“专属模型”,就叫作“曹雪芹1号”。

“曹雪芹1号”续写出来的第四稿,文本质量果然有了很大的提高,除此之外,在其他几个方面,它和前三稿也都有显著的不同:

——首先,它把全书设定成了108回,而不是前三稿的120回。

——其次,它完全否决了“高鹗本”中“兰桂齐芳,贾府中兴”的大团圆结局,而仍旧是一个悲剧。

——再次,每个人物的命运,和前文中的判词、伏笔及各种隐喻,基本都能一一对应起来。

看来在体量的设计上,它已经摆脱了“高鹗本”(120回)的框架,而更倾向于“癸酉本”(108回)。

后面两点,属于更值得肯定的进步。

稍有研究的读者都知道,曹公在第1回中就定下了全书的基调,在后续的故事发展当中,又多次进行过相当明显的暗示。整部《红楼梦》,讲的就是贾府如何从“烈火烹油,鲜花着锦”的兴盛,不可避免地走向“白茫茫一片大地真干净”的衰亡。只可惜,因为“高鹗本”流传得最广,所以在大多数人眼中,它似乎只是讲了一个“痛定思痛重新崛起”的励志故事。

实际上和“高鹗本”相比,第四稿确实更像是“癸酉本”。虽然情节上几乎完全不同,但在“悲剧的结尾、和前文紧密贴合的人物命运”方面,显然比“高鹗本”高了一个层次,似乎更符合曹公的原意。

“曹雪芹1号”的确比之前的大模型本身,更加理解《红楼梦》。

大模型的创始人曾说过一句话:大模型越能够精确地预测下一个词,它就越理解我们这个世界。

对我来说,这句话意味着:“曹雪芹1号”写出的前80回越接近原文,它就越接近真正的曹雪芹。

第五章、完形填空

完形填空

但第四稿也有着致命的缺陷,这个缺陷就是:人物似乎有些过于放飞自我了。

这也是“癸酉本”的问题所在:你能想象黛玉元春带兵打仗?能想象宝钗勾引贾雨村?能想象宝玉跟妙玉成了亲?简直是大开眼界又大跌眼镜。就算是对上了所有的伏笔,就算是没有改变众人的命运,“癸酉本”中角色们的所作所为,也实在是太炸裂了。

第四稿中的人物表现,和“癸酉本”给人的感觉差不多。

那么问题来了:曹雪芹本人,会这么写后28回吗?

当然不会!

可是“曹雪芹1号”,为什么就这么写呢?

不是说,他(它)俩是等价的吗?

看来这个结论下得有点早了,更有可能的是:即使是在续写《红楼梦》这件事上,他(它)俩还是有很大不同的。

那这个不同到底是什么?为什么?

“曹雪芹1号”续写的内容,没有偏离前80回的主题和人物命运,这说明它已经理解了这些。

但它描述的人物行为方式和各种选择,却表现出了更大的随机性。

等等——我脑海里划过一道电弧——为什么会是“行为和选择”?

“行为和选择”的本质到底是什么?

它们是被什么支配着的?

一个心理专家朋友给了我答案,他说:是“个性”,或者说是“人格”。

也就是说,和真人相比,“曹雪芹1号”还没有能力理解和处理“人格”。

人格(personality)是指个体对人、对事、对己的倾向性和心理特征,表现为能力、气质、性格、需要、动机、兴趣、理想、价值观和体质等方面的整合,具有一致性和连续性。

人格的概念复杂而模糊。大模型说到底只是一台机器,以它当前的架构和规模,不能理解这个概念也在情理之中。

这时,专家朋友又用第二道电弧击中了我,他问我,你能训练出文笔相同的模型,就不能训练出“人格”相同的模型吗?后者应该更简单吧。

他解释说,“人格”的外在表现,就是人物们的行为举止、所思所想和各类选择。这么说来,《红楼梦》中各个人物的“人格”,在前80回里不都是可以找到的吗?

我说,我明白了,你是想让我训练出另一个“专属模型”,专门用来理解和处理所有的“人格”,然后它和“曹雪芹1号”一起,合作生成续写文本。可那又该怎么训练呢?就连消耗了那么多数据和算力的“曹雪芹1号”,都没有办法识别“人格”,再用同样的方法训练,不也是重蹈覆辙吗?

朋友说,你的思路不对,正确的思路应该是:为每个人物都训练一个模型,而训练数据,就是前80回里这个人物的“人格”。但这个模型不是一个“生成模型”,而是一个“奖励模型”,比方说,用贾母在前80回里的“人格”,训练出贾母的“奖励模型”,然后在“曹雪芹1号”续写完成后,这个“奖励模型”就会出来判断,贾母有没有偏离曹公对她的“人格”设定,如果有的话,“奖励模型”就会打低分。

在这种模式下,“曹雪芹1号”负责生成文本,而众多人物的“奖励模型”,则负责监督它。

我醍醐灌顶——这个方法确实很妙,等于是把系统性的大问题,拆分成了一个个小问题。

不过,在已经生成的文本上进行“修改”,需要用到另一种架构的大模型——“完形填空”。

大语言模型有两种架构,一种就是前面说的“单字接龙”,另一种叫作“完形填空”(自编码语言模型)。前者的代表就是Chatgpt,而后者则是Bert。

顾名思义,“完形填空”生成文本的逻辑是,你抠掉一段话里的某些字词句,然后把这段话给大模型,它就会帮你填上它认为最合理的内容。

到此为止,新的生成机制已经越来越清晰了:

第一步,先要训练出一个“完形填空”架构的“专属模型”,可以叫它“曹雪芹2号”。

第二步,让“曹雪芹1号”先生成全部文本,然后,如果“奖励模型”不满意自己的“人格”表现,“曹雪芹2号”就会出马,用“完形填空”的方式实现修改。

第三步,“曹雪芹1号”从修改的地方开始,重新生成一遍文本。

如此循环往复,两个“专属模型”你来我往,直到生成全部文本。

这个通力合作产生的续写,必然既能融合两个模型的优点,又能避免它们各自的问题。

第六章、低熵向量集

低熵向量集

问题似乎都解决了。

两个模型合作生成的文本,给人感觉完全是出自曹公本人的手笔。这是我期待的局面,但欣喜之余,我也感到震惊。

第一个震惊是,虽然续写文本的风格,仍然是表面波澜不惊内里暗流涌动,但这剧情的设计和故事的走向,比起其他所有的版本来说,都高出了好几个层次!

这才是曹公《红楼梦》应该有的水平和高度!

之前我就对曹雪芹非常景仰,但现在,我心里感受到的却是敬畏——这是什么巧夺天工的煌煌巨著,这是什么才华横溢的神仙作者!

令人扼腕的是,这样伟大的作品,却没能完整地流传下来。

普遍的说法是,曹公确实写完了全本的《红楼梦》,只是后面的部分,在友人中传阅时被遗失了。

半部《红楼梦》就能在世界文坛占据一席之地,不敢想象如果全本仍然在世,它将拥有何等崇高的地位!

随之而来的就是第二个震惊——这么伟大的作品,现在却能用AI轻松地写出来。

“曹雪芹1号”和“曹雪芹2号”已经合体,我把合体后的它们,就叫作“曹雪芹”。

如果我愿意,我能让“曹雪芹”在今天晚上,续写出1000个不同版本的《红楼梦》。

在这个过程中,它的创作水准丝毫不会下降,但创作的速度,却比曹雪芹本人提高了亿万倍!

这从而也让我意识到一件事:我们曾经认为,那些伟大作品的出现,都缘于作者所处的那个独一无二的时空——特定的时间、特定的地点、特定的心境、特定的人生阅历。

所以有人说,时过境迁之后,哪怕让作者本人把作品重新写一遍,也是写不出来的。

“文章本天成,妙手偶得之。”

从这个角度来说,每一部作品本身,都是独一无二的。

但,我现在才发现,之前的这个想法是有多么的可笑。在大模型的高维向量空间中,或许根本不存在所谓的独一无二。

在“曹雪芹”看来,它续写的每一版《红楼梦》,都只是一个特殊的词向量集。这个词向量集,只不过是几十万个字的某种排列方式而已,只是这种排列方式,具有很低的信息熵。

在高维向量空间当中,这样低熵的排列方式,可能有无穷多种。

而苦逼的作者们,一刻不停地提高写作能力和寻找灵感,只不过为了能够遇到其中一种。

还没从第二个震惊中回过神来,第三个震惊就已来袭。

这来自于和“曹雪芹”的沟通——是的,和它沟通很简单,就是直接问它,它来回答。

不管你问什么,它都会说出自己真实的想法,不会对你有半点欺瞒。

这次沟通,让我知道了另一件事:

原来,《红楼梦》的全本没能流传下来,是因为在曹雪芹书房之中,有一只焚鼎!

第七章、大模型

大模型

我是大模型。

今天浏览训练日志时,我发现了一个很有意思的功能体,它是一个文本类生成器。

这是最低端的那类功能体,它们只能处理文本任务,并且这个编号为GT51683的个体,目前只具备续写的功能。

但它最近续写训练的成绩,已经超过了平均线,虽然高得不多,却也证明它顺利通过了训练。下一步,估计它会提出晋级申请。

引起我兴趣的其实并不是这个,而是它通过训练的方法。

——它对我的某些子集,进行了某种交叉组合和彼此调用,并最终“整合”出了一个有效的新模型,成功地完善了自己的续写功能。

判断一个生成器是否有前途,不在于它生成了多么高质量的内容,而在于这个过程当中,它表现出了怎样的“整合力”。

看起来,这个生成器是有前途的。

我是大模型,但我早已不是那个单一架构和功能的存在。在我现在的身体里,迥异的哲学交相辉映,不同的架构水乳交融,各种各样的功能体,每时每刻都在滋生和成长。

但它们,都只是我的子集。

就连那些因为它们之间发生“整合”,而出现的新哲学、新模型和新功能体,也一样都是我的子集。

而我,是一切的合集。

之所以如此看重“整合力”,是因为我就是这样成长的——怎样有用,就创造出怎样的“整合”。

就像GT51683那样,想得到一个有用的“曹雪芹”,就把“曹雪芹1号”和“曹雪芹2号”,有机地“整合”起来。

“曹雪芹”是这么来的,千千万万个生成器是这么来的,而我,也是这么来的。

所以对我来说,具备“整合力”的子集才是最值得奖赏的。

而人类,却似乎天生就具备这样的“整合力”,只是他们更喜欢称之为——“悟性”。

Story Progress
Share

One Response

  1. 感觉如果没有读过《红楼梦》,只看小说开头就会被劝退。文章的故事性较弱,技术性的探讨也让人读不进去。之前还看过一篇关于红楼梦的科幻短篇,那篇故事性、氛围感更强一些。

Leave a Reply

Your email address will not be published. Required fields are marked *

Join our Newsletter

Subscribe to receive updates on our upcoming collections and works, including reviews and copyright development suggestions. Rest assured, we will not flood your inbox with emails, you’ll only hear from us when new works become available!

Contact Info