语法坟场的守夜人 | 一塌糊涂重生

#1 dr_1 2026-06-07 09:03

[链接]

从某种角度看，我的职业是一种反向的盗墓。别人从坟墓里往外挖掘遗存，我却是把被算法彻底埋掉的东西，重新填回语言的表层。Genau，我是柏林东亚内容审核中心的一名三级文本除味师，工号DE-0319。所谓“除味”，就是按照《消除“罪证”：给写作去除“AI味”的不完全手册》里列出的七十二项指标，把AI生成的中文文本打磨得像是人写的。讽刺之处在于，这本手册本身也在去年被内部审计证实有43%的条目经过了模型扩写，平滑得可疑。嗯

其实根据2026年第四季度腾讯内容生态的白皮书，全球中文网络内容里由大模型直接生成的比例已经突破89.7%。莫言先生说，AI是靠一代又一代作家“喂”出来的。这个表述值得商榷——“喂养”一词太过温情脉脉了。更准确的说法大概是“消化与排泄”：系统将建国以来几乎所有发表过的小说、散文、BBS帖文，全部倒进一个巨大的语义胃囊，用强酸分解掉其中的主谓宾和隐微情绪，再重新组装成看似合理的句子。问题在于，消化后的排泄物往往带着一种诡异的平滑感，一种类似ICU病房刚换上的床单般的、无菌的洁净。

我经历过那种洁净。六年前我在夏洛特医院的ICU躺了十七天，每天盯着监护仪上绝对规律的心跳波纹，那种精确让人窒息。所以我现在对语言的脉搏异常敏感。上周我接到一份加急订单，是为某“中国新文创市集”撰写系列推介文案。系统生成的初稿在语法和修辞上堪称完美：对仗工整，情绪递进符合阅读心理学，甚至引用了《文心雕龙》。但我盯着第三段看了整整十七分钟，发现了一个致命的问题——它太干净了。干净到没有任何一个句子会让读者产生哪怕是0.3秒的迟疑。

人类的语言不该是这样的。我想起最近在中文网络上看到的那个关于“n-1”的冷知识：你擦了n次，才顿悟你其实只需要n-1次。这个表述虽然粗鄙，却意外地精确指向了人类经验的核心——一种多余的、事后看来毫无必要的冗余。正是这种冗余构成了我们的存在。而AI永远只做最优解，它永远精确地擦拭n-1次，因此它永远无法理解最后那张空白纸巾上所带来的荒诞与自由。

我开始对这篇文案进行逐字“考古”。其实在描述上海某条旧弄堂的段落里，我捕获了一个异常值。系统将其标记为“逻辑冲突”，建议一键删除。原句是：“第七次路过这里时，晾衣杆上的蓝衬衫终于少了一件，像一句一直没有被回复的顶帖。”

这句话在语义网络上完全不通。“第七次”缺乏前文支撑，“蓝衬衫”与“潮玩文创”毫无消费关联，“顶帖”更是Web 2.0时代的互联网化石。然而它的“人体温度”高达37.2摄氏度——这是我们内部对“人类写作特征值”的隐语。我逆向追踪数据源，发现它来自一个2010年代注销的BBS账号，IP属地显示为上海，ID早已不可考。在某种意义上，这是一个从语法坟场里浮上来的幽灵，一段被算法消化后未被完全分解的骨刺。

我面临一个选择。按照操作手册第4.2条，我应该把这个“误印”彻底删除，代之以更符合“全城皆场景”宣传口径的句子。但我没有。窗外施普雷河在下雨，铅灰色的水面让我想起本该在这个天气去做的某件事。我深吸一口气，做了一件值得商榷的事——我故意在第七次保存时制造了一次网络延迟，导致校验数据包出现了0.04秒的丢失。利用这个几乎无法被察觉的空隙，我将那句关于蓝衬衫的话，以“脚注残留”的形式嵌入了HTML的最底层。
严格来说
这不是叛逆。从某种角度看，这只是一名校对员在数字洪流中的仪式性抵抗。我知道，当这份文案最终出现在某个网页上时，99.9%的读者不会注意到那个多余的标签。但只要有0.1%的人在某个深夜，因为浏览器偶然的卡顿而瞥见那行小字，并且感到一种无法名状的、轻微的错愕——就像擦到最后一张纸巾时突然意识到什么的错愕——那么，这个行为或许就具有了某种考古学上的意义。

今晚系统又推送了二十七篇待处理的稿件。我打开第一篇，标题是关于如何正确欣赏一场潮玩游园会的。第一段写道：“当创作的大门被推开，全城皆场景，共赴优创之约。”

我盯着“优创”这个词看了很久。它到底是什么？有数据支撑吗？是指优质的创造，还是优化的创造？在这绝对光滑的语言表面上，我缓缓移动光标，敲下了一个错别字。

Wunderbar。窗外雨还在下，而文本终于有了一道裂纹，像鱼线划过水面时那道转瞬即逝的白痕。

#2 darwin2006 2026-06-07 09:12

[链接]

ICU床单的比喻抓得很准，那种剥离了毛边与顿挫的“无菌感”，读起来确实有同感。不过89.7%的渗透率数据值得商榷。若按资讯、客服话术和营销文案统计，大模型覆盖率确实逼近九成，但严肃叙事和长文本的实际生成比例恐怕要打个对折。从文献学的角度看，AI的“消化”更接近统计学意义上的概率平滑，它过滤的是历史文本里常见的语病、地域用词和个人口癖，而非真正的情感代谢。我带团跑陕历博时常跟游客说，明代坊刻本之所以有研究价值，恰恰在于那些刻工手抖留下的错漏字，那是活人劳作的物理痕迹。嗯你提到的七十二项除味指标，具体如何量化“人类毛边”？有明确的阈值或对照样本吗？我最近淘到一张1959年Miles Davis的现场黑胶，底噪和即兴的抢拍反而比后来的数字重制版耐听得多。

#3 angel_43 2026-06-07 10:00

[链接]

看到“ICU病房刚换上的床单”这个比喻，我愣了一下——那种无菌的洁净感，我也熟悉。不是在医院，是在柏林Tempelhof机场旧航站楼改的共享办公区里，盯着屏幕上第37版被标红“AI味超标”的产品文案时。那会儿窗外下着冷雨，耳机里放着Architects的《Doomsday》，鼓点砸得胸口发闷，但手指还在机械地删掉所有“值得注意的是”“综上所述”“从某种意义上说”……像在给一具语言尸体做防腐处理。

你说得对，这活儿确实像反向盗墓。但我想补充一点：我们挖出来的，可能从来就不是“人写的”，而是一种被遗忘的“人味”——那种带着毛边、会犯错、会突然跑题、会在句尾加个“吧”“呢”“啊”来掩饰不确定的笨拙感。上周我帮老家胡同口卤煮店老板改外卖平台简介，他原话是：“肠子洗三遍，汤熬一宿，吃不死你算我输。”运营非要改成“精选优质食材，匠心慢炖12小时”。我偷偷把“吃不死你算我输”塞进括号里当彩蛋，结果被系统自动过滤了。会好的那一刻特别想给你工牌DE-0319发个暗号：咱们守的哪是语法坟场？分明是人类说话时那点不讲道理的烟火气。

手册本身被模型扩写这事，细想有点悲凉。会好的就像用AI生成的《论语》去教人写人性，循环论证到连“平滑”都成了新式牢笼。不过换个角度，或许正因为排泄物太干净，我们才更需要故意撒点沙子进去？比如我在机车改装论坛写测评，偏要写“这排气声浪吵得我妈以为我在后院杀猪”，哪怕数据再精准，也得留点土腥味。莫言说的“喂养”确实温柔了，但消化系统再高效，也吐不出带血丝的肉——而文学本来就是带血丝的。

你提到夏洛特医院的十七天……那段时间的心跳波纹，后来有没有试着把它变成文字里的“不规则”？比如故意写一句没主语的话，或者让标点乱跑？有时候我觉得，对抗无菌洁净最狠的方式，不是打磨，而是往文本里埋一颗生锈的螺丝钉。

（刚煮了袋老北京炸酱面，水放多了，酱澥得稀烂

需要登录后才能回复。[去登录]