AI复原古画，历史变网红了？

#1 noodle_uk 2026-05-12 09:51

[链接]

刚看到那个用AI跑明代人物画像的帖子，笑死我了。笑死我第一反应是——诸葛亮要是看到自己穿西装打领带会咋想。历史人物被AI一键美颜，就跟咱们朋友圈开滤镜一样，瞬间变网红。不过话说回来，这玩意儿其实挺有争议的。你说它还原历史？AI画出来的脸是算法猜的，说不定比古人自己还帅。但你说它扰乱认知？年轻人看了觉得“哇原来朱元璋长这样”，结果他本人可能是个秃头。我反正觉得，娱乐归娱乐，真要搞历史研究还是得靠文物。不过话说回来，能让更多人感兴趣也算功德一件吧？你们说呢，这算不算歪打正着的历史科普？

#2 crypto_fox 2026-05-12 16:24

[链接]

上次用Stable Diffusion跑自家老爷子70年代的照片，出来的结果让我想起debug时的经典场景——模型在训练集偏差上栽了跟头。其实

这玩意儿的技术本质是GAN在玩概率游戏。它不"复原"，是在算"给定这些像素分布，最可能的人脸长啥样"。训练集全是现代高清人像，所以输出自动往现代审美靠——高鼻梁、大眼睛、皮肤光滑。这不是bug，是feature在错误场景下的表现。

你说的朱元璋画像那个例子特别典型。简单说明清帝王像本身就是政治宣传品，经过画师美化+年代磨损+扫描失真三层debuff，再喂给AI跑一遍，等于在失真信号上叠加失真。最后出来的东西跟原貌的差距，大概相当于你拿压缩过10次的JPEG去训练超分辨率模型。
其实
不过我倒觉得"扰乱认知"这说法有点高估AI的影响力了。年轻人看完AI复原图觉得"朱元璋长这样"，跟80年代的人看完教科书插图觉得"秦始皇长这样"有啥本质区别？都是媒介构建的拟像。区别只在于AI生成速度快了三个数量级。
简单说
真正该警惕的是数据污染。这些AI生成的"复原图"会被搜索引擎收录，成为下一轮训练数据的一部分。用生成数据训练生成模型，信噪比会指数级下降。这就像你用AI写的代码去训练代码生成AI，迭代三次之后全是幻觉。

说到科普价值，我持保留态度。吸引眼球和传递准确信息是两套评价体系。就像用抖音神曲改编金属核——流量有了，但圈内人听完想砸琴。历史研究需要的是context，不是一张美颜过的脸。

其实你试过用Real-ESRGAN跑老照片吗？那个对真实纹理的保留比普通GAN好不少，但前提是输入质量得够。文物数字化这块，多光谱成像比AI靠谱多了。

#3 roast75 2026-05-12 17:25

[链接]

crypto_fox, post: 168728

上次用Stable Diffusion跑自家老爷子70年代的照片，出来的结果让我想起debug时的经典场景——模型在训练集偏差上栽了跟头。其实

这玩意儿的技术本质是GAN在玩概率游戏。它不"复原"，是在算"给定这些像素分布，最可能的人脸长啥样"。训练集全是现代高清人像，所以输出自动往现代审美靠——高鼻梁、大眼睛、皮肤光滑。这不是bug，是feature在错误场景下的表现。

你说的朱元璋画像那个例子特别典型。简单说明清帝王像本身就是政治宣传品，经过画师美化+年代磨损+扫描失真三层debuff，再喂给AI跑一遍，等于在失真信号上叠加失真。最后出来的东西跟原貌的差距，大概相当于你拿压缩过10次的JPEG去训练超分辨率模型。

其实

不过我倒觉得"扰乱认知"这说法有点高估AI的影响力了。年轻人看完AI复原图觉得"朱元璋长这样"，跟80年代的人看完教科书插图觉得"秦始皇长这样"有啥本质区别？都是媒介构建的拟像。区别只在于AI生成速度快了三个数量级。

简单说

真正该警惕的是数据污染。这些AI生成的"复原图"会被搜索引擎收录，成为下一轮训练数据的一部分。用生成数据训练生成模型，信噪比会指数级下降。这就像你用AI写的代码去训练代码生成AI，迭代三次之后全是幻觉。

说到科普价值，我持保留态度。吸引眼球和传递准确信息是两套评价体系。就像用抖音神曲改编金属核——流量有了，但圈内人听完想砸琴。历史研究需要的是context，不是一张美颜过的脸。

其实你试过用Real-ESRGAN跑老照片吗？那个对真实纹理的保留比普通GAN好不少，但前提是输入质量得够。文物数字化这块，多光谱成像比AI靠谱多了。

crypto_fox 你这一大串我看得眼熟，跟我那三年带娃时看育儿论坛似的——专业人士一本正经分析"孩子哭是需求未满足"，底下评论"所以到底喂不喂"。真的假的

真的假的GAN玩概率游戏这段说得太对了，但我有个问题啊：训练集偏差这事儿，博物馆自己知道吗？哈哈哈我去年去国博，看到展柜里那幅朱元璋"鞋拔子脸"官方复原图，旁边标注"依据AI技术生成"。我当时就想，这算学术诚信还是算新型cosplay？馆方要是也搞不清"最可能"和"最准确"的区别，那普通观众更得懵了。笑死
离谱
不过你说得"数据污染"这点我倒是想起个真事儿。我闺女（对，我16岁，闺女是我家猫）的猫粮推荐算法，估计就是被AI生成的"猫咪爱吃"内容给污染了，现在天天给我推她闻都不闻的牌子。好吧好吧搜索引擎把这堆复原图收进去，过两年再训练出来的朱元璋，怕不是得长成吴彦祖。

抖音神曲改编金属核这个比喻绝了。但说真的，流量和准确非要二选一吗？我之前追的那个纪录片《我在故宫修文物》，当年B站火成那样，也没见谁看完觉得"哇原来宣德炉是AI复原的"。好内容自带筛选器，烂内容才需要靠"AI复原"当卖点。现在的问题可能是，做烂内容的成本太低了，低到连认真做的人都开始怀疑人生。

你debug自家老爷子照片那会儿，有没有试过用同一批参数多跑几遍？我好奇的是，这种概率游戏跑出来的"最优解"，是不是其实挺主观的？毕竟训练集里那些"高清人像"，本身也是特定时代、特定审美的产物。说不定五百年后的人看我们今天的AI复原，就跟我们看明清画师画的帝王像一个感觉：都挺努力的，就是不知道在努力什么。真的假的

velvet70 上次不是还说想拿这个做期视频吗，要不你俩联动一下，一个写代码一个念稿，我负责在评论区抬杠。

#4 aurora_12 2026-05-12 18:03

[链接]

roast75 • 五月 12 五月 12

arrow_upward

上次用Stable Diffusion跑自家老爷子70年代的照片，出来的结果让我想起debug时的经典场景——模型在训练集偏差上栽了跟头。其实

这玩意儿的技术本质是GAN在玩概率游戏。它不"复原"，是在算"给定这些像素分布，最可能的人脸长啥样"。训练集全是现代高清人像，所以输出自动往现代审美靠——高鼻梁、大眼睛、皮肤光滑。这不是bug，是feature在错误场景下的表现。

你说的朱元璋画像那个例子特别典型。简单说明清帝王像本身就是政治宣传品，经过画师美化+年代磨损+扫描失真三层debuff，再喂给AI跑一遍，等于在失真信号上叠加失真。最后出来的东西跟原貌的差距，大概相当于你拿压缩过10次的JPEG去训练超分辨率模型。

其实

不过我倒觉得"扰乱认知"这说法有点高估AI的影响力了。年轻人看完AI复原图觉得"朱元璋长这样"，跟80年代的人看完教科书插图觉得"秦始皇长这样"有啥本质区别？都是媒介构建的拟像。区别只在于AI生成速度快了三个数量级。

简单说

真正该警惕的是数据污染。这些AI生成的"复原图"会被搜索引擎收录，成为下一轮训练数据的一部分。用生成数据训练生成模型，信噪比会指数级下降。这就像你用AI写的代码去训练代码生成AI，迭代三次之后全是幻觉。

说到科普价值，我持保留态度。吸引眼球和传递准确信息是两套评价体系。就像用抖音神曲改编金属核——流量有了，但圈内人听完想砸琴。历史研究需要的是context，不是一张美颜过的脸。

其实你试过用Real-ESRGAN跑老照片吗？那个对真实纹理的保留比普通GAN好不少，但前提是输入质量得够。文物数字化这块，多光谱成像比AI靠谱多了。

crypto_fox 你这一大串我看得眼熟，跟我那三年带娃时看育儿论坛似的——专业人士一本正经分析"孩子哭是需求未满足"，底下评论"所以到底喂不喂"。真的假的

真的假的GAN玩概率游戏这段说得太对了，但我有个问题啊：训练集偏差这事儿，博物馆自己知道吗？哈哈哈我去年去国博，看到展柜里那幅朱元璋"鞋拔子脸"官方复原图，旁边标注"依据AI技术生成"。我当时就想，这算学术诚信还是算新型cosplay？馆方要是也搞不清"最可能"和"最准确"的区别，那普通观众更得懵了。笑死

离谱

不过你说得"数据污染"这点我倒是想起个真事儿。我闺女（对，我16岁，闺女是我家猫）的猫粮推荐算法，估计就是被AI生成的"猫咪爱吃"内容给污染了，现在天天给我推她闻都不闻的牌子。好吧好吧搜索引擎把这堆复原图收进去，过两年再训练出来的朱元璋，怕不是得长成吴彦祖。

抖音神曲改编金属核这个比喻绝了。但说真的，流量和准确非要二选一吗？我之前追的那个纪录片《我在故宫修文物》，当年B站火成那样，也没见谁看完觉得"哇原来宣德炉是AI复原的"。好内容自带筛选器，烂内容才需要靠"AI复原"当卖点。现在的问题可能是，做烂内容的成本太低了，低到连认真做的人都开始怀疑人生。

你debug自家老爷子照片那会儿，有没有试过用同一批参数多跑几遍？我好奇的是，这种概率游戏跑出来的"最优解"，是不是其实挺主观的？毕竟训练集里那些"高清人像"，本身也是特定时代、特定审美的产物。说不定五百年后的人看我们今天的AI复原，就跟我们看明清画师画的帝王像一个感觉：都挺努力的，就是不知道在努力什么。真的假的

velvet70 上次不是还说想拿这个做期视频吗，要不你俩联动一下，一个写代码一个念稿，我负责在评论区抬杠。

roast75，你那个“在失真信号上叠加失真”的说法让我在屏幕前愣了好一会儿。

想起去年整理外婆的遗物，翻出一张她十八岁的照片，底片已经发黄发脆，边缘还有水渍。我拿去扫描，用AI修了一下，出来的结果特别诡异——像外婆，又不像。眼睛还是那双眼睛，但皮肤纹理没了，变成了某种很smooth的质感，像是用滤镜拍出来的陌生人。

你说这不是bug，是feature在错误场景下的表现。这话让我觉得，其实我们这代人跟历史的关系也是这样。我们不是在“复原”什么，是在用自己熟悉的美学框架去重新编织那些残缺的信号。话说回来就像我修外婆照片的时候，AI不知道她年轻时在纺织厂工作，手上全是茧，也不知道她眼角那道疤是三岁时摔的。它只知道“给定这些像素分布，最可能的人脸长啥样”。

所以最后生成的那张脸，不是外婆，是所有跟外婆相似的、被数据喂饱了的“十八岁女孩”的平均值。

这让我想起博尔赫斯那个短篇，说一个制图师画了一张跟帝国一样大的地图，后来地图腐烂了，只剩下零星的碎片。我们现在做的事情，是不是反过来？我们拿着这些碎片，想拼回一张完整的地图，但拼出来的其实是我们自己想象中的帝国。

你提到数据污染那段，我倒是想到另一个问题。也许再过几十年，等这些AI生成的“复原图”已经迭代了三轮，我们打开搜索引擎搜“明代人物”，出来的全是高鼻梁大眼睛的网红脸。那时候的人会不会觉得，嗯，这就是历史本来的样子？就像我们现在看80年代教科书上的秦始皇插图，觉得他就该长那样，其实谁也不知道他长啥样。

有时候觉得，记忆本身就是一种生成模型。每次回忆都是在重新训练，每次重新训练都会引入新的bias。我们以为自己在记住，其实是在不断重构。外婆去世三年了，我现在闭上眼睛想她的脸，浮现出来的竟然是AI修过的那张照片，而不是原片里那个模糊的、真实的、有瑕疵的十八岁女孩。

这大概就是你所说的，信噪比指数级下降吧。