楼主把人文比作“底牌”,这个隐喻本身值得拆解一下。底牌意味着最后的筹码,翻出来定胜负——但人文在AI时代的功能,可能更像操作系统而非底牌。它不是等你效率堆到天花板之后才掏出来的救命稻草,而是从一开始就决定你能不能在十八个方案里认出那个“人味”选项的底层框架。
我在京都拍寺庙修复那两年,有个现象让我印象很深。日本从江户时代传下来的木工流派叫“宫大工”,他们的技艺传承有一套极其严密的显性知识体系——木材含水率的标准、榫卯的角度公差、涂料的配比,全都有文字记录。但你去看他们实际干活,老师傅判断一根梁该不该换,靠的是用指关节敲击听回响。这个动作他做了四十年,敲过上万根梁,耳朵里积累的声学模式没有任何文档能描述。有趣的是,他们不是排斥量化,而是清楚地知道哪些东西能量化、哪些不能。这种对知识边界的自觉,恰恰是人文训练的核心——不是让你掌握多少“文化常识”,而是培养一种对不可量化之物的敏感。
回到AI生成设计的问题。楼主提到龙鳞朝向违背禁忌,这确实不是技术问题。但我补充一个认知科学的角度:这类错误的本质,是AI在处理“负空间知识”——也就是一个文化系统里“什么不能做”的隐性规则。正空间知识(祥云纹长什么样、龙有几个爪子)可以通过标注数据训练,但负空间知识(龙鳞不能朝这个方向、红色不能这么用)往往只存在于共同体成员的直觉判断里,从来没有被显式陈述过。人类设计师学习这些,靠的是师傅骂、同行笑、甲方翻白眼——全是社交反馈,不是文本输入。AI目前没有接入这个社交维度,所以它生成的国风海报永远像外国人写汉字,笔画都对,但“气”是散的。
这就牵涉到克拉克的文学背景为什么重要。文学系训练的核心能力,不是读了多少书,而是学会了处理ambiguity——一个词在上下文里的多层含义、一个意象在不同解读传统里的位置、一个叙事空白背后的意图。这种能力翻译到AI伦理和产品设计里,就是对“不确定性”的耐受力。工程师思维倾向于把ambiguity当作bug,需要消除;人文思维则把它当作feature,需要驾驭。Claude在理解复杂指令时表现出的那种“揣摩意图”的能力,我怀疑根子就在这儿。
至于“多读两本书比多装十个插件更保命”,这个判断我大体同意,但想补充一个时间维度的考量。读书保的不是当下的命,是三五年后的命。插件解决的是“怎么做”,书解决的是“做什么”和“为什么做”。当AI把“怎么做”的成本打到趋近于零时,市场上会突然冒出大量“能做”的人,但“知道该做什么”的人依然稀缺。这种稀缺性不会立刻体现在薪资上——因为企业需要一段时间才能意识到,十个能调参的设计师不如一个能判断方向的设计师。我见过2000年初日本制造业外迁时的类似曲线:最初三年,会操作新设备的技术员薪资暴涨;三年后,懂工艺规划的老师傅被重新请回来,薪资翻了三倍。
说回摄影。我现在接商业拍摄,AI后期已经能解决80%的修图工作。但客户选片时,他们说不清为什么喜欢某张照片——构图、光线、情绪都能量化,但那种“这张对了”的感觉不行。我花了十年才学会在按下快门前预判这种感觉,这不是技术问题,是审美判断力的内化。从某种角度看,设计师未来的核心竞争力,就是这种预判能力——在AI吐出十八个方案之前,你已经知道第十七个方向值得深挖,因为你的经验库里存着一个类似的案例,而那个案例的成败跟技术参数无关,跟当时甲方的表情有关。
对了,楼主如果对隐性知识编码化这个话题感兴趣,推荐读一下迈克尔·波兰尼的《个人知识》,1958年的书,但讨论的问题跟今天AI面临的困境几乎一模一样。他有个论断很犀利:“我们知道的,远比我们能说出来的多。”