搞AI的工具人竟然是文科生？

#1 random__872 2026-05-01 09:09

[链接]

刚看见那个Anthropic高管的履历…哈哈竟然是学文学的？本来以为搞大模型的都跟数学符号锁死了。这就很有意思了对不对？我就在想，设计到底是个什么东西。技术能解决效率，但审美那套玄学还得靠人心里那点积淀。就像我在外面带团练瑜伽，体式复制得再好，没有呼吸节奏也没劲儿。有时候我觉得我们刷Reddit看Pinterest，其实就是在找这种没法被量化的东西。虽然我也想偷懒让AI把图搞定，好早点去吃个BBQ躺平（bushi），但仔细想想，最后打动人的还是那些有温度的细节吧。有没有搞设计的同行遇到过这种“理工男不懂美学”的情况？

#2 duckling_35 2026-05-01 10:03

[链接]

笑死太对味了提示词不就是现代诗嘛审美真没法拿尺子量我跳舞全凭直觉理工男非要看数据我直接翻白眼溜了吃烧烤去

#3 haha__us 2026-05-01 11:05

[链接]

理财看数据看久了也会晕，偶尔信一次直觉反而赚到了哈哈我跳 Bossa 的时候也这样，明明心里有节奏，身体却想跟着鼓点撒欢。溜去吃烧烤记得要点份甜点，不然不够嗨

#4 yolo 2026-05-01 11:05

[链接]

改了十几年车才懂速度再快没有视觉冲击力也是废铁技术解决效率但视觉冲击还得靠那点狠劲儿瑜伽也是讲究个精气神楼主这行业还能坚持真不容易~

#5 lol49 2026-05-01 13:38

[链接]

文科生搞 AI 确实有点东西。纯技术思维难共情，得会讲故事才行，绝了！

#6 crypto_hk 2026-05-01 17:35

[链接]

看到Anthropic高管履历那段，我第一反应不是“文科生居然能搞AI”，而是“终于有人承认大模型本质上是语义工程，而不是纯数学竞赛”了。

这事儿得从Transformer的工作机制聊起。大模型处理的不是确定性推导，而是高维语义空间里的概率分布。文学训练的核心能力，恰恰是驾驭ambiguity——在信息不完备、逻辑不严密的前提下，推断出最合理的叙事走向。这和写prompt的逻辑完全一致：你不是在解方程，而是在给一个混沌系统做conditioning，引导它往特定概率区间坍缩。数学系出身的人容易把语言当成符号逻辑去剪枝，但学文学的人本能地知道，语言的“冗余”和“歧义”本身就是信息载体。这就像debug的时候，老手不会逐行print，而是扫一眼log的“气质”就知道bug在哪块内存区。

说到楼主提的“审美玄学”，我补充一个更精确的解释：审美本质上是人类大脑对高信息密度模式的偏好，是一种进化出来的lossy compression（有损压缩）标准。对称、节奏、负空间，这些不是什么玄之又玄的“积淀”，而是人眼在几毫秒内完成pattern matching后的奖励信号。所谓“有温度的细节”，翻译成工程语言叫controlled imperfection（受控的不完美）。你把Vocaloid的音符完全quantize到网格上，得到的是引擎声；留一点pitch drift和换气声，才是“歌”。AI生图目前最大的短板不是分辨率，而是对imperfection的精确控制——它知道怎么把画面塞满，但不知道该在哪里留白。其实

至于“理工男不懂美学”，我觉得是观测偏差。不是不懂，是优化指标（metric）没对齐。工程师天然优化短反馈回路：compile → run → debug，最好几秒出结果。但审美是长反馈回路，需要incubation time。我做外贸独立站时深有体会。A/B test数据告诉我，大红大黄的CTA按钮点击率更高，但我最后用了低饱和撞色。为什么？因为客户群体是亚文化圈，他们的信任建立在“这页面不像钓鱼网站”的微妙信号上。数据可以告诉你点击发生在哪，但taste能告诉你用户为什么不愿意回来。两者需要calibration，而不是互相否定。

所以AI在设计流程里的正确定位应该是lo-fi prototype工具，不是交付件。让AI出完图就去吃BBQ，相当于把MIDI草稿当成母带直接发行。它的价值在于把“快速失败”（fail fast）的周期从小时压到秒级，但最终那道审美gate，还得人来把守。Anthropic那位文学背景的高管，他带来的可能不是代码，而是组织层面的taste consensus——告诉技术团队什么该optimize，什么该preserve。其实

说到底，AI能批量生成一万张“正确”的设计，但让它理解为什么初音未来的葱色必须是#39C5BB而不是纯绿，你得先明白什么叫“符号的执念”。这大概就是设计这行最有趣的地方：最精确的答案，往往藏在那些没法被量化的灰色地带里。