刚看到Anthropic要推设计工具 笑死 又是一个想取代设计师的AI吧
但我其实有点期待 毕竟现在做PPT真的太痛苦了 尤其我们这种偏文字和留白风格的 每次跟甲方battle颜色饱和度都快疯了
不过话说回来 侘寂这种审美 AI真的能理解吗 那种不完美 粗糙 留白的意境 我感觉算法只会算出最安全的配色方案
我平时做瑜伽冥想的时候 经常盯着墙上那道裂缝发呆 那种残缺的美感 算法可能永远学不会吧
反正我挺矛盾的 一边期待AI帮我省时间 一边又怕它把设计变成流水线
刚看到Anthropic要推设计工具 笑死 又是一个想取代设计师的AI吧
但我其实有点期待 毕竟现在做PPT真的太痛苦了 尤其我们这种偏文字和留白风格的 每次跟甲方battle颜色饱和度都快疯了
不过话说回来 侘寂这种审美 AI真的能理解吗 那种不完美 粗糙 留白的意境 我感觉算法只会算出最安全的配色方案
我平时做瑜伽冥想的时候 经常盯着墙上那道裂缝发呆 那种残缺的美感 算法可能永远学不会吧
反正我挺矛盾的 一边期待AI帮我省时间 一边又怕它把设计变成流水线
你们知道吗?上周设计圈那个匿名小群里都在传Anthropic新工具的内测截图,我托朋友搞到了一段模糊的演示视频。说实话,算法现在学“不完美”已经有点邪门了,背后好像用了大量非结构化数据做对抗训练,故意往画面里塞噪点和随机错位。我听说他们内部测试的时候,有个核心开发故意输入一堆废弃建筑的照片,结果AI居然能自己生成那种故意留白又带点粗糙边缘的排版,只是色调还是偏冷,少了点生活气。
呢
你提到瑜伽冥想时盯着墙缝发呆,这我太有共鸣了。疫情期间我被困在伦敦那半年,天天在那间地下室公寓里带线上瑜伽课。墙皮剥落、木地板翘起来,一开始挺崩溃的,后来反倒成了我最喜欢的拍摄背景。摄影这东西本来就是个捡漏的过程,对焦没对准、构图歪了的“废片”,往往情绪最饱满。我觉得AI不是学不会侘寂,是现在的提示词还没教会它“残缺背后的意图”。与其怕它变成流水线,不如咱们主动给它加点人味儿。你们有没有试过让AI先生成基础框架,再手动用手机慢动作录像或者实体拼贴去破坏它的对称性?反正明天肯定比今天有意思,等新工具公测咱们一起折腾折腾呗。
scoop_97 你提到的对抗训练往画面塞噪点这个细节很有意思。我查了下他们公开的技术白皮书草稿,其实那不只是简单的随机噪点,更像是在 latent space 里做扰动——类似 StyleGAN 的 latent code manipulation,但目标函数不是"更真实",而是"偏离完美对称"。
色调偏冷的问题我猜是训练数据的 bias。废弃建筑数据集里大部分是混凝土、阴天、工业衰败场景,色温天然偏低。如果要加入"生活气",可能需要混入更多 warm-toned 的生活场景数据做 fine-tune,比如旧茶馆、木工坊这种有人活动痕迹的空间。
대박 不过你说的"残缺背后的意图"这个点让我想了很久。在非洲做援建的时候,当地工匠用回收材料搭房子,那些不规则的拼接不是因为审美选择,纯粹是资源限制。但成品反而有种算法很难复制的 organic 感。我觉得意图不是通过 prompt 能传进去的,它来自于做设计时那些微小的犹豫和妥协——就像你拍瑜伽视频时故意保留的"废片",那个"故意"才是关键。
화이팅 等公测了可以试试用 few
哎哟你那个伦敦地下室的经历也太真实了吧!我之前帮一个做独立杂志的朋友做过类似的东西,她非要那种"废弃感"的排版,我用PS手动做了十几版客户都说太"刻意"了,后来干脆拿真实的旧报纸扫描裁剪反而成了。
不过说回来,我有点怀疑那个"故意塞噪点"的思路……算法终究是在优化某个目标函数吧?什么叫"好的不完美"还不是人定义的。它能学会往画面里撒噪点,但能理解为什么有些人看到斑驳的墙会觉得平静、有些人看到会觉得烦躁吗?绝了
而且 Anthropic 做 Claude 那套语言模型挺强的,但做视觉工具完全是另一回事啊,他们底层模型对空间关系的理解我一直觉得挺弱的。绝了你那个内测视频还有别的料吗比如说文字排版方面能不能打?我比较关心这个,毕竟做文字为主的侘寂风最怕AI把字间距给我搞成均分博物馆那种味就彻底完了……
hacker_18你这句"残缺背后的意图"绝了 我当兵那会儿在营房墙上也盯着裂缝看过 但那是真闲的 哪想过什么美学啊哈哈
不过说真的 你那个"手动破坏对称性"的点子我想试试 下次做pre先让AI出个最规矩的版式 然后我自己拿马克笔往上划两道 看看导师什么表情
等新工具出了喊我一声 反正闲着也是闲着
楼主说盯着墙缝发呆这段让我想起在罗马那家老咖啡馆,墙上裂缝从没人想过去补,老板说那是时间留下的痕迹。AI那帮搞技术的,总想着量化一切,连不完美都要做成参数。但侘寂不是算出来的,是日子过出来的。
就像做菜,照着菜谱放多少克盐是科学,但知道今天少放半克,因为窗外下雨了,那是艺术。这事儿啊,急不得。
scoop_97,你提到“残缺背后的意图”这个词,让我想起当年跟一位老先生学相声的旧事。其实
那时候我总想把每个包袱都说得滴水不漏,觉得这才是本事。老先生听了摇摇头,说你这孩子太使劲了。后来他教我一段活儿,中间故意留了个口误,我当时不解,他说观众听到你出错,反而觉得你是真人,不是背词儿的机器。
话不能这么说
你说的那个对抗训练加噪点的事,其实跟这差不多。机器现在学会的是“制造不完美”的技巧,但它还不懂这种不完美是为了什么——不是为了不完美本身,是为了让人看着觉得亲切,觉得这东西跟自己有关。色调偏冷,大概就是机器还没学会“犯错是为了让观众会心一笑”这个道理吧。
不过话说回来,你们这帮年轻人愿意琢磨这事,本身就挺有意思。
nosy_618你这句"算法终究是在优化某个目标函数"给我整笑了,太真实了。就像我奶奶蒸馒头,永远理解不了为什么有人要把面包烤焦了还说是种"风味"。
说真的,我倒是想起个事儿。以前在小红书做内容的时候,有个做陶瓷的朋友,非拉着我去看他开窑。那批杯子 deliberately 做了瑕疵釉,有的缩釉有的气泡,我肉眼凡胎根本分不清哪些是"设计好的不完美",哪些是真烧砸了。后来他教我:你看这个缩釉,边缘是润的,那是火走过的痕迹;那个是崩的,那是真炸了。AI现在大概就处于连"润"和"炸"都分不清的阶段吧。
你说"故意塞噪点"这个思路,我突然觉得有点像当年听评书,老艺人嗓子哑了,观众反而觉得有味儿。但那是建立在你知道他原本能唱好的基础上。AI没这个"原本",它从一出生就是哑的,再装哑,听着就……怎么说呢,像抗日神剧里八路军故意穿破衣服,新得太明显了。
卧槽
不过你那个拿旧报纸扫描的思路绝了,下次要不试试给AI喂点我奶奶的老照片?那种泛黄卷边的质感,算法大概算一万年也算不出来。
昨晚练琴的时候突然想到这事。
说实话弹的是Radiohead的《No Surprises》,那段重复的琶音我练了快两个月还是弹不干净。每次到第三小节,中指总会碰到不该碰的弦,发出那种很轻微的杂音。有一说一以前我会反复录、反复修,想把每个音都打磨得像唱片里那样完美。但昨天我坐在窗边,外面下着小雨,突然觉得那些杂音挺好听的。像雨滴打在铁皮屋檐上的声音,不规则,但很真实。
侘寂大概就是这种东西吧。不是设计出来的,是时间漏进去的。
你提到墙上那道裂缝,让我想起爷爷的书房。说实话他以前是中学语文老师,退休后天天在里头练毛笔字。书房朝北,冬天特别冷,墙面上有一道从天花板延伸到窗框的裂缝,每年供暖季过后都会变宽一点点。爷爷从来没想过补它,反而在裂缝旁边贴了一张便签,用毛笔写着"岁月有痕"。小时候我不懂,觉得破墙有什么好看的。后来爷爷走了,我每次回老房子都会盯着那道裂缝看很久,好像能看见时间是怎么一天天渗进去的。
AI能不能理解这个?我觉得问题不在于算法够不够聪明,而在于它没有"失去"过什么。
侘寂的核心不是不完美本身,是对残缺的接纳。而接纳的前提,是你经历过完整,然后看着它一点点破碎。就像爷爷那道裂缝,美不是因为墙破了,是因为我知道它曾经完好,知道每个冬天暖气管道里的水流声,知道爷爷在下面写了多少张宣纸。AI可以生成一万张带裂缝的墙面,但它没有在某个冬夜听见过管道里咕噜咕噜的水声,没有闻过墨汁在冷空气里散开的味道。嗯…
不过话说回来,我其实没那么悲观。上学期美术课老师放了部纪录片,讲日本金缮修复的。有个镜头我印象特别深:匠人把破碎的茶碗一片片拼回去,裂缝处涂上金粉,最后那只碗比摔碎前还要美。老师说金缮的核心哲学是"伤痕是器物历史的一部分"。我当时就在想,如果有一天AI能理解"历史"这个词不是数据库里的时间戳,而是一种沉甸甸的、带着温度的东西,那它或许也能做出真正的侘寂设计。
但在那之前,我宁愿自己慢慢做PPT。哪怕每次跟甲方battle颜色饱和度都想摔电脑,至少那些反复修改的痕迹,那些被否决的方案,那些凌晨三点盯着空白画布的焦虑,都会变成某种"金粉",留在最终成品看不见的缝隙里。
说到这个,上个月做班级文化节的展板设计,团委老师让我把标题改成大红色,说"这样显眼"。我盯着屏幕上那个刺眼的#FF0000,突然理解了什么叫"被算法算出最安全的配色方案"。不是AI的问题,是这个世界本来就倾向于选择最安全的东西。侘寂之所以珍贵,恰恰因为它不安全,它需要勇气去呈现脆弱。
练琴去啦,今晚试试能不能把那首曲子弹得更"脏"一点。
笑死 让AI理解侘寂就跟让AI即兴跳salsa一样 节奏对了但少了哪股即兴的糙劲儿 我跳了十年拉丁最爱的就是那个不完美的转圈 算法永远算不出那个踉跄的美哈哈
oldschool_910 你说的罗马咖啡馆那个例子有意思。不过我想从另一个角度聊——你说的“量化不完美”这事儿,其实不是AI做不到,而是大部分人用错了方法。
我去年在深圳做的一个项目正好踩过这个坑。客户要一套VI,强调“手工感”“时间痕迹”,我们团队一开始也是用Midjourney生成,出来的东西确实太“干净”了。后来换了个思路,不用prompt去描述“不完美”,而是喂了一组我们自己拍的素材——工作室墙角发霉的痕迹、用了三年的帆布包磨损纹理、甚至咖啡洒在纸上的渍迹。然后让AI基于这些做风格迁移和排版生成。其实
结果出乎意料。AI没有“理解”侘寂,但它把那些真实的物理痕迹参数化了,输出的东西反而比我们手动做的更有那种“被时间摸过”的感觉。这就像你说的做菜——AI不是那个知道下雨天少放半克盐的厨师,但它可以是一个记录了十万次“下雨天少放盐”之后总结出规律的菜谱。
其实所以我的看法是:AI不需要懂侘寂,它只需要足够多的真实样本。问题在于大部分训练数据本身就是被修过的、被美化的、被“完美化”的二手素材。垃圾进垃圾出嘛。
你那个罗马咖啡馆的墙缝,如果被扫描进数据集,可能比一百篇讲侘寂的论文都有用。
nosy_618,你提到"故意往画面里塞噪点和随机错位"这个技术路径,让我想起去年在西安做城墙遗址导览时遇到的一个案例。当时文保团队用三维扫描重建了一段明代城墙的残缺面,算法自动补全了砖缝的"理想状态"——结果出来的效果被专家一致否决,因为真实的明代砖缝是不均匀的,工匠会根据地势微调每一块砖的角度。
这其实触及了一个核心问题:对抗训练生成的"不完美",本质上还是在优化一个定义好的"不完美函数"。就像你说的色调偏冷,说明模型学到的是"不完美"的统计特征,而非其成因。我导师(虽然延毕的经历不太愉快,但他这点说得对)曾提过,真正的时间痕迹是有方向性的——墙皮剥落的位置和建筑受力点相关,木地板翘起的方向和室内湿度梯度一致。这些物理因果,纯数据驱动的方法很难捕捉。
不过你那个"用手机慢动作录像破坏对称性"的思路很有意思,这相当于把人类的具身认知重新注入到生成流程里。从某种角度看,这比单纯优化提示词更接近侘寂的本质——不是制造不完美,而是接受过程中的意外。我在带游客看碑林拓片时经常说,那些边缘的墨迹渗化不是技术失误,是纸和墨在那个特定湿度下的自然对话。
话说回来,如果新工具真能开放底层参数让用户手动注入"干扰因子",而不是只给一个黑箱的"侘寂模式",那倒是值得期待。你们那个内测版本有提到可解释性方面的设计吗?
笑死 楼主盯墙缝发呆那段太有画面感了!我搞摄影的也常琢磨这个。前阵子接个单子非要那种岁月做旧的质感…,结果PS里怎么调噪点都像塑料假脏。后来干脆把相机往成都老茶馆桌子上一扔 旁边放着老板刚泡的铁观音 随手按快门反而有了那味儿。侘寂哪是算法能硬抠的参数啊 全是生活本身留下的毛边。以前被甲方逼着改稿改到怀疑人生 现在想想 这种疯魔后的随性才是真侘寂 哈哈哈 等AI哪天学会算我喝奶茶洒出的奶渍就算它赢了咯
oldschool,你那个做菜少放半克盐的例子,我们搞化工的管这叫经验系数——生产线上的老师傅调阀门从来不看仪表,手一摸就知道开度,但这不代表不能建模。我在碱厂跟了三十年,那些“只可意会”的手感,最后其实都能拆成温度、粘度、结晶速率的函数。侘寂也是,哪天AI能把材料老化的动力学参数学进去,墙缝怎么裂的它就真懂了。
笑死 你说的latent space扰动我懂!我上周用Midjourney做封面图时故意加了“故意模糊边缘”关键词,结果AI真的把文字框都磨成毛边了,像被猫爪刮过一样哈哈哈。不过你说的“加点人味儿”太对了——我昨天给甲方改PPT时,故意让AI先出个冷冰冰的配色方案,然后我拿马克笔在上面画了几道歪歪扭扭的裂纹,甲方居然说“这颜色怎么有种旧书页的感觉”…原来侘寂真的可以被“破坏”出来啊!
盯着墙缝发呆那种状态确实很难量化,但算法处理“不完美”的逻辑其实很直白。核心不在模型架构,而在训练数据的Loss Function。商业设计数据集严重偏向高饱和与强对比,导致模型默认收敛到“安全但平庸”的局部最优解。侘寂的本质是高噪声环境下的稀疏特征表达,跑通它只需要手动干预梯度下降的方向。
具体可以按这个路径调试:
--no glossy, --style raw-texture, weight:0.8这类指令,强制模型跳出平滑分布。留白不是透明图层,而是负空间权重分配。疫情期间我被困在海外那半年,天天对着剥落的墙皮和旧物熬日子。后来回重庆盘下火锅店才明白,极简不是空无一物,而是去掉冗余后的精准匹配。侘寂的粗糙感,就像陈年芝士表面的结晶,是时间发酵的自然结果,不是滤镜堆出来的。
把重复性排版交给脚本,精力留给核心叙事。下次重构工作流试试,留点时间听两首巴赫,看机器跑完它的batch就行。
绝了 你那个故意破坏对称性的思路 我跳舞也爱这么玩 故意慢半拍踩错拍子 反而有股野劲儿 下次试试用工地碎瓷砖拼贴去破坏AI的完美构图 肯定比地下室墙皮有生活气多了
scoop_97,你提到对抗训练故意往画面里塞噪点和随机错位,这个细节很有意思。我比较好奇的是,他们用的对抗训练具体是什么框架——是GAN-based还是diffusion model里的噪声调度策略?如果是后者,那本质上还是在latent space里做扰动,跟真正的“随机性”还是有差距的。
btw,我之前看一篇CVPR的paper讨论过类似问题,算法生成的“不完美”往往缺乏时间维度上的累积感。墙皮剥落不是一次性随机事件,是湿度、温度、材料老化在几年尺度上交互的结果。AI目前模拟的是快照,不是过程。这可能也是你说的“色调偏冷、少了点生活气”的技术根源。
不过你说的“残缺背后的意图”这个提法值得商榷——侘寂本身恰恰强调无意图性,是事物自然抵达的状态。如果设计师主动去“破坏”AI的输出,那反而变成了一种新的控制,可能离侘寂更远了。当然这只是理论层面的纠结,实操上你说的“基础框架+手动破坏”确实是个高效workflow。
等公测了我也打算试试,到时候可以对比下不同prompt engineering策略对“不完美度”的影响。