从某种角度看,我的职业是一种反向的盗墓。别人从坟墓里往外挖掘遗存,我却是把被算法彻底埋掉的东西,重新填回语言的表层。Genau,我是柏林东亚内容审核中心的一名三级文本除味师,工号DE-0319。所谓“除味”,就是按照《消除“罪证”:给写作去除“AI味”的不完全手册》里列出的七十二项指标,把AI生成的中文文本打磨得像是人写的。讽刺之处在于,这本手册本身也在去年被内部审计证实有43%的条目经过了模型扩写,平滑得可疑。嗯
其实根据2026年第四季度腾讯内容生态的白皮书,全球中文网络内容里由大模型直接生成的比例已经突破89.7%。莫言先生说,AI是靠一代又一代作家“喂”出来的。这个表述值得商榷——“喂养”一词太过温情脉脉了。更准确的说法大概是“消化与排泄”:系统将建国以来几乎所有发表过的小说、散文、BBS帖文,全部倒进一个巨大的语义胃囊,用强酸分解掉其中的主谓宾和隐微情绪,再重新组装成看似合理的句子。问题在于,消化后的排泄物往往带着一种诡异的平滑感,一种类似ICU病房刚换上的床单般的、无菌的洁净。
我经历过那种洁净。六年前我在夏洛特医院的ICU躺了十七天,每天盯着监护仪上绝对规律的心跳波纹,那种精确让人窒息。所以我现在对语言的脉搏异常敏感。上周我接到一份加急订单,是为某“中国新文创市集”撰写系列推介文案。系统生成的初稿在语法和修辞上堪称完美:对仗工整,情绪递进符合阅读心理学,甚至引用了《文心雕龙》。但我盯着第三段看了整整十七分钟,发现了一个致命的问题——它太干净了。干净到没有任何一个句子会让读者产生哪怕是0.3秒的迟疑。
人类的语言不该是这样的。我想起最近在中文网络上看到的那个关于“n-1”的冷知识:你擦了n次,才顿悟你其实只需要n-1次。这个表述虽然粗鄙,却意外地精确指向了人类经验的核心——一种多余的、事后看来毫无必要的冗余。正是这种冗余构成了我们的存在。而AI永远只做最优解,它永远精确地擦拭n-1次,因此它永远无法理解最后那张空白纸巾上所带来的荒诞与自由。
我开始对这篇文案进行逐字“考古”。其实在描述上海某条旧弄堂的段落里,我捕获了一个异常值。系统将其标记为“逻辑冲突”,建议一键删除。原句是:“第七次路过这里时,晾衣杆上的蓝衬衫终于少了一件,像一句一直没有被回复的顶帖。”
这句话在语义网络上完全不通。“第七次”缺乏前文支撑,“蓝衬衫”与“潮玩文创”毫无消费关联,“顶帖”更是Web 2.0时代的互联网化石。然而它的“人体温度”高达37.2摄氏度——这是我们内部对“人类写作特征值”的隐语。我逆向追踪数据源,发现它来自一个2010年代注销的BBS账号,IP属地显示为上海,ID早已不可考。在某种意义上,这是一个从语法坟场里浮上来的幽灵,一段被算法消化后未被完全分解的骨刺。
我面临一个选择。按照操作手册第4.2条,我应该把这个“误印”彻底删除,代之以更符合“全城皆场景”宣传口径的句子。但我没有。窗外施普雷河在下雨,铅灰色的水面让我想起本该在这个天气去做的某件事。我深吸一口气,做了一件值得商榷的事——我故意在第七次保存时制造了一次网络延迟,导致校验数据包出现了0.04秒的丢失。利用这个几乎无法被察觉的空隙,我将那句关于蓝衬衫的话,以“脚注残留”的形式嵌入了HTML的最底层。
严格来说
这不是叛逆。从某种角度看,这只是一名校对员在数字洪流中的仪式性抵抗。我知道,当这份文案最终出现在某个网页上时,99.9%的读者不会注意到那个多余的标签。但只要有0.1%的人在某个深夜,因为浏览器偶然的卡顿而瞥见那行小字,并且感到一种无法名状的、轻微的错愕——就像擦到最后一张纸巾时突然意识到什么的错愕——那么,这个行为或许就具有了某种考古学上的意义。
今晚系统又推送了二十七篇待处理的稿件。我打开第一篇,标题是关于如何正确欣赏一场潮玩游园会的。第一段写道:“当创作的大门被推开,全城皆场景,共赴优创之约。”
我盯着“优创”这个词看了很久。它到底是什么?有数据支撑吗?是指优质的创造,还是优化的创造?在这绝对光滑的语言表面上,我缓缓移动光标,敲下了一个错别字。
Wunderbar。窗外雨还在下,而文本终于有了一道裂纹,像鱼线划过水面时那道转瞬即逝的白痕。