奖励函数

    论文里的字像一群焦躁的蚂蚁,在视网膜上爬行,却拒绝组成任何有意义的信息。

    温禾第一百次把视线从笔记本电脑屏幕上挪开,感觉太阳穴突突地跳。图书馆窗明几净,空气里弥漫着旧书和消毒水的混合气味,安静得能听见隔壁座男生均匀的呼吸声——他睡得正香。

    “个体在高度规训化社会中的无力感……”她心里默念着这个论文小标,感觉它像一副沉重的镣铐,不仅铐住了她笔下的研究对象,也正把她自己往深渊里拖。

    不是比喻,是生理性的。几次全麻手术留下的记忆已经模糊,但身体却顽固地记着那种虚弱和剥离感,仿佛灵魂和身体之间总隔着一层磨砂玻璃,看什么都隔着一层,使不上劲。

    胃里泛起熟悉的空洞感,不是饿,是那种精气神被抽干后的下坠。

    她想起早上母亲那条长达59秒的微信语音,还没点开,光是看到那个红点,窒息感就先一步掐住了她的喉咙。不用听也知道内容:隔壁家谁谁又发表了顶刊论文,谁谁申请到了常青藤的博士,最后总会落到一句:“禾禾 ,你要抓紧,爸爸妈妈为你付出了这么多……”

    付出。这个词像一枚精确制导的导弹,总能准确命中她深埋的愧疚引信。她的人生仿佛一场永无止境的“补偿”之旅,补偿父母付出的时间、金钱、期望。可她连自己的电量都快耗尽了,拿什么去补偿?

    她合上电脑,发出轻微的“啪”一声。宣告今天对抗无效的投降。与其在这里被理论的洪流淹没,不如去天台吹吹风,虽然那里的风也带着这座钢铁森林的尾气味。

    教学楼的顶层天台是温禾的秘密据点。这里通常空无一人,只有几个锈迹斑斑的通风管嗡嗡作响,以及城市天际线冰冷的轮廓。

    但今天,有人。

    一个清瘦的男生靠在最远处的栏杆上,背对着她,望着楼下蝼蚁般的车流。他穿着简单的灰色卫衣和牛仔裤,侧影融入细雨蒙蒙的天空,像一幅静止的画面。

    温禾下意识地想退回去,但对方似乎察觉到了动静,回过头来。

    他的表情很平静,没有被打扰的不悦,也没有社交性的热情,更像是一台处于待机状态的设备,摄像头捕捉到了移动物体,自动激活。

    他的眼神在她脸上停留了一秒,那眼神很深,带着一种…分析感?不是审视,更像是在读取数据。

    “抱歉,不知道这里有人。”温禾低声道,准备离开。

    “没关系。”他的声音不高,有点哑,像是很久没说话了一样,“地方很大。”

    他转回头去,继续看着楼下,似乎对她失去了兴趣。这种毫不黏腻的社交距离让温禾奇异地放松下来。她走到栏杆的另一头,和他隔开五六米的距离,也趴了下去。

    沉默在两人之间蔓延,却不尴尬。只有风声和城市模糊的白噪音。

    温禾偷偷瞥了他一眼。他手指在栏杆上无意识地轻轻敲打着,节奏稳定,像是在敲代码?她注意到他脚边放着一本厚厚的书,标题看不清,但似乎和算法有关。

    一个理工男。

    她心里给他贴上标签。

    和她所在的、充满人性纠结与理论辩论的人文社科领域截然不同的世界。那个世界在她想象里是由清晰的逻辑、确定的答案和高效的解决方案构成的。

    真好啊。她莫名有些羡慕。

    她拿出手机,麻木地刷着社交媒体。光鲜亮丽的生活碎片、激烈的社会争论、无孔不入的焦虑营销……信息洪流冲击着她本就过载的神经。她忍不住发出一声极轻的、几乎听不见的叹息,像一只被戳破的气球。

    “信息过载导致的情绪低谷?”

    声音突然从旁边传来,平稳地叙述,没有疑问的语调,更像是在陈述一个观察结论。

    温禾吓了一跳,猛地抬头,发现那个男生不知何时已经转过头,正看着她。他的目光依旧平静,没有窥探隐私的冒犯感,反而有种实验室里观察小白鼠跑迷宫的纯粹好奇。

    “……什么?”

    “持续刷动短内容,尤其是带有强烈情绪色彩的内容,会大量消耗认知资源,却无法形成有效记忆和满足感。大脑的奖赏回路被频繁刺激但得不到真正满足,反而会加剧焦虑和空虚感。”

    他解释道,语气像在复述一篇论文的摘要,“这很像我们训练模型时遇到的‘探索-利用困境’——漫无目的地探索新信息,却无法有效利用已知的优质信息。”

    温禾愣住了。这大概是第一次,有人用这种……非人类的方式解读她的“丧”。没有“想开点”,没有“出去走走”,而是一套冷冰冰的技术分析。

    奇怪的是,她居然没觉得被冒犯。也许是因为这种分析剥离了那些令人疲惫的情感包袱和道德评判,让她的问题听起来像是一个可以研究的技术性问题,而不是她个人的失败。

    她鬼使神差地回了一句:“那……解决方案呢?给你们模型的解决方案。”

    男生似乎思考了一下,然后非常认真地回答:“通常我们会给它一个更明确的奖励函数,或者限制它的探索范围,引导它进行更有价值的‘ exploitation’(利用)。或者……直接重启一下。”

    “重启……”温禾喃喃道,要是人也能一键重启就好了。

    男生忽然弯腰,从他的书包侧袋里拿出一小盒东西,走过来,递给她。是一种电解质粉剂。

    “看你脸色不太好。低电量的时候,补充电解质比喝咖啡有用。”他顿了顿,补充道,“这是物理意义上的‘重启’基础。”

    温禾迟疑地接过。包装盒是极简的白色,没有任何花哨的logo。

    “谢谢……”

    “不客气。”他点点头,没有再多的寒暄,收拾起自己的东西,似乎准备离开。走到天台门口时,他停下脚步,半回过头。

    “那个……”他似乎在斟酌用词,“如果你觉得‘探索’得太痛苦,也许可以试试先定义一下你自己的‘奖励函数’?哪怕很小。”

    说完,他拉开门,身影消失在楼梯间。

    温禾捏着那盒微凉的电解质粉,站在空旷的天台上,第一次感觉脑子里那些喧嚣的、自我攻击的声音停了下来,只剩下一个清晰的、带着技术冷静感的疑问:

    “我的……奖励函数?”

    风还在吹,城市的噪声依旧。但有什么东西,仿佛被那个像AI一样奇怪的男生,轻轻地撬开了一条缝。

    那盒电解质粉被温禾放在了书桌一角,像一个来自未知文明的奇特 artifact(非自然存在物体)。她没有立刻喝掉它,仿佛一旦喝了,就真的承认了自己需要某种“系统优化”。

新书推荐: 帮总裁奶奶相亲后被误认成诈骗犯 (猎人同人)来自深渊 末日求生百变安全屋 欢迎光临██客栈[经营] 躲疯批老公的日常 女子野心[八零年代] 重生后嫁给绿茶小哑巴 病蛇饲养手册 我在民国读大学 我在废土世界当入殓师