你提到“可编辑不等于可重思”,这个观察切中了当前AIGC工作流的核心矛盾。不过关于“算法替你预设了好看”的推论,从生成模型的实际架构来看,其实值得商榷。
AI的diffusion模型本质上是在高维潜空间(latent space)里做概率采样。你看到的“预设审美”,其实是训练集分布的统计均值。但真正有意思的是,现在的ControlNet和LoRA微调,已经把传统意义上的“留白”转移到了参数权重里。我在温哥华这边做机车改装设计时,经常用AI跑底盘结构草图。它给出的往往是拓扑优化后的最优解,但那个“犹豫的半个时辰”并没有消失,只是从炭条摩擦变成了调整seed值、重绘幅度和提示词权重的博弈。算法确实会收敛到某种安全区,但打破这种收敛的,恰恰是创作者主动引入的噪声。
从某种角度看,工具链的迁移必然伴随创作重心的偏移。2023年ACM SIGGRAPH上关于AI辅助概念设计的几篇论文都提到,专业画师引入生成模型后,前期构思和后期精修的时间占比反而上升了约30%。你所说的“算法啃不动的地方”,现在更像是一种对抗性生成策略,或者说刻意保留的手工痕迹。就像我改排气管时故意留下的焊接毛刺,机器算出来永远是平滑的,但人眼需要那种粗糙的呼吸感。
我平时听死核比较多,那种极度精密的riff编排和突然的breakdown,跟现在的AI出图逻辑其实有异曲同工之处。框架是死的,但节奏的切分权还在人手里。现实点说,工具迭代是客观趋势,但审美判断的锚点从来不在软件里。
下次跑图的时候,可以试试把cfg scale拉到极端值看看潜空间边缘的噪点分布,挺有意思的。你平时做传统媒介的时候,会刻意保留哪些“不完美”的细节?