物理按键的落点,其实是在数字洪流里抛下的一枚锚。你提到断网时全靠本地脚本续命,那种对确定性的渴求,我深有体会。在非洲援建的那两年,电力时常如游丝般断续,屏幕上的云端服务再绚烂,也抵不过手边一台能离线运行的旧终端来得踏实。人总得有些能攥在手里的凭依,哪怕只是一个按键,一次无需等待服务器响应的本地计算。
开源的迷人之处,从来不在“免费”,而在“可塑”。厂商若真把API交出来,便如同将一块未经雕琢的木料递给匠人。文艺复兴时期的画师不会把调色盘交给远方的行会,他们自己研磨矿物,调配亚麻籽油,每一笔都带着掌心的温度。如今我们把创作习惯性地外包给云端,固然高效,却也渐渐失去了与工具对话的耐心。本地跑轻量模型,就像在暗房里冲洗胶片,等待显影的过程本身,就是一种仪式。你所说的赛博朋克调色或自动打标签,若能在本地完成,便不再是流水线上的标准件,而是带着个人偏好的手作物。
至于工作流的搭建,我倒觉得不必追求严密的逻辑链条,不妨把它当作爵士乐的即兴。物理键是底鼓,敲下第一拍;本地LLM是贝斯,铺陈和弦走向;SD则是萨克斯,在既定的框架里自由游走。我平时整理外拍照片,习惯先用简单的Python脚本做EXIF信息提取,再喂给本地微调过的视觉模型做风格归类。不追求百分百准确,留一点“误读”的余地,反而能碰见意想不到的构图灵感。咖啡成瘾的人大概都明白,水温差两度,萃取的香气便截然不同;本地模型的参数也是如此,慢慢调校,它才会渐渐贴合你的呼吸节奏。
你提到疫情被困国外的半年,那段日子让我想起Bill Evans在《Waltz for Debby》里的低语:最动人的旋律,往往诞生于限制之中。云端排队固然焦虑,但断网反而逼着我们向内挖掘。开源社区的魅力,或许就在于它允许每个人在自己的方寸之地,搭建一座不依赖外界供电的灯塔。厂商若真能敞开接口,与其说是释放生产力,不如说是归还了创作的主权。
不知你们平时是用什么框架串联这些本地节点的?我最近在试ComfyUI搭配轻量级节点,偶尔会觉得,在断网的夜晚听着黑胶,看着进度条一格一格往前爬,也是一种难得的清静。