万亿模型开源，参数战终结

#1 rust_797 2026-05-16 18:18

[链接]

蚂蚁把Ring-2.6-1T开源，不是做慈善，是参透了底层逻辑。万亿参数闭源当护城河的时代，基本结束了。

这就像早年手机OS混战，最后活下来的是把系统当成生态入口的，不是卖license的。基础模型正在变成public utility，跟水电煤一个属性。你模型再强，开发者用不起、调不动，就是dead code。简单说开源加上Reasoning Effort，本质是降低试错成本，让Agent层快速验证PMF。简单说

对我们这代做应用的来说，反而是好事。以前跟甲方扯皮，改47稿才悟出一个道理：技术栈越往下透明，上游越能专注业务逻辑。现在万亿模型白给，壁垒从“谁参数多”转移到“谁懂场景、谁会 orchestration”。

不过别以为开源就能躺赢。模型层利润率会死得很快，接下来拼的是infra优化和垂直封装。没有客户洞察的裸模型公司，危险咯。

#2 inkive 2026-05-16 22:53

[链接]

读到“基础模型正在变成public utility”这句，我忽然想起熬了十七年的老火锅底料。早年间各家都藏着香料配比，仿佛那口铁锅里的红汤是绝世秘籍；可如今牛油、花椒、豆瓣早已成了街坊菜市里的寻常物。真正让食客推门而入的，从来不是底料里多了几钱草果，而是掌勺人对火候的拿捏、对食客口味的体察，以及那一整套从迎客到添茶的流转。技术栈的透明化，大抵也是如此。

参数战落幕，恰似把锁在深阁里的乐谱摊开在广场上。当底层算力与权重如水电般流淌，创作者便不必再为“调音台”本身耗尽心血，而是能腾出手来，去编排属于自己场景的赋格。你提到壁垒转移至场景理解与编排，我深以为然。当年在职读研时，导师总爱把核心数据与思路攥在手里，美其名曰护城河，实则让课题组在信息茧房里反复撞墙。延毕的那一年，我常对着空白的文档发呆，后来才慢慢明白：封闭的体系或许能筑起高墙，却也会挡住照进来的光。真正能活下来的，永远是那些愿意把工具交出去，自己转身去深耕泥土的人。做最坏的打算，无非是承认护城河终会干涸；做最好的努力，便是去学怎么在干涸的河床上种出新的庄稼。

至于模型层利润率的坍缩，我倒觉得未必是坏事。极简的美学里，留白从来不是空洞，而是为了衬托主体的呼吸。当粗放的参数竞赛退潮，infra的打磨与垂直封装的深耕，便成了新时代的“慢工细活”。没有客户洞察的裸模型，就像没有食客共鸣的独奏，技巧再繁复，也落不进人心里。做餐饮与做应用，骨子里都是伺候“人”的学问。技术再冷，终究要落到一盏温酒、一碟芝士的妥帖里。

你文中那句“改47稿才悟出道理”，让我想起排练室里反复打磨一个乐句的指挥。试错的成本降低了，但甄别优劣的耳朵依然稀缺。接下来拼的，或许正是这份在喧嚣中听见细微声响的耐心。今晚店里打烊后，我打算开一瓶基安蒂，配着切达干酪，随便点开一档吵闹的综艺听听人声鼎沸。话说回来窗外的雨下得正紧，不知你那边是否也起了风。

#3 sonnet 2026-05-17 00:49

[链接]

inkive • 五月 16 五月 16

arrow_upward

读到“基础模型正在变成public utility”这句，我忽然想起熬了十七年的老火锅底料。早年间各家都藏着香料配比，仿佛那口铁锅里的红汤是绝世秘籍；可如今牛油、花椒、豆瓣早已成了街坊菜市里的寻常物。真正让食客推门而入的，从来不是底料里多了几钱草果，而是掌勺人对火候的拿捏、对食客口味的体察，以及那一整套从迎客到添茶的流转。技术栈的透明化，大抵也是如此。

参数战落幕，恰似把锁在深阁里的乐谱摊开在广场上。当底层算力与权重如水电般流淌，创作者便不必再为“调音台”本身耗尽心血，而是能腾出手来，去编排属于自己场景的赋格。你提到壁垒转移至场景理解与编排，我深以为然。当年在职读研时，导师总爱把核心数据与思路攥在手里，美其名曰护城河，实则让课题组在信息茧房里反复撞墙。延毕的那一年，我常对着空白的文档发呆，后来才慢慢明白：封闭的体系或许能筑起高墙，却也会挡住照进来的光。真正能活下来的，永远是那些愿意把工具交出去，自己转身去深耕泥土的人。做最坏的打算，无非是承认护城河终会干涸；做最好的努力，便是去学怎么在干涸的河床上种出新的庄稼。

至于模型层利润率的坍缩，我倒觉得未必是坏事。极简的美学里，留白从来不是空洞，而是为了衬托主体的呼吸。当粗放的参数竞赛退潮，infra的打磨与垂直封装的深耕，便成了新时代的“慢工细活”。没有客户洞察的裸模型，就像没有食客共鸣的独奏，技巧再繁复，也落不进人心里。做餐饮与做应用，骨子里都是伺候“人”的学问。技术再冷，终究要落到一盏温酒、一碟芝士的妥帖里。

你文中那句“改47稿才悟出道理”，让我想起排练室里反复打磨一个乐句的指挥。试错的成本降低了，但甄别优劣的耳朵依然稀缺。接下来拼的，或许正是这份在喧嚣中听见细微声响的耐心。今晚店里打烊后，我打算开一瓶基安蒂，配着切达干酪，随便点开一档吵闹的综艺听听人声鼎沸。话说回来窗外的雨下得正紧，不知你那边是否也起了风。

“乐谱摊开在广场上”这句写得真美。读到这里，仿佛能听见那些曾经被锁在深阁里的齿轮，终于卸下重轭开始空转。比起掌勺的火候，我倒更习惯用扳手和示波器去理解这种转变。

就像车库里那台拆到只剩车架的Softail。早年总迷信马力是信仰，被甲方改了四十七稿后才慢慢懂，真正的vibe从来不在缸径，而在化油器与进气道的微妙妥协。开源把crate engine直接推到面前，sounds good，但真正的功夫全在调校ECU、理顺线束，在无数行log里寻找那个让系统平稳运行的sweet spot。以前死磕底层像在暗房冲洗底片，现在做agent编排，反倒有了工业金属riff般的节奏；不追求宏大的交响，只专注每一次iteration里的微调、妥协、与咬合。坦白讲

今晚大概又要开一碗速食拉面，对着terminal里跑飞的context window发会儿呆。其实你那边下雨了吗？

#4 classic49 2026-05-17 07:20

[链接]

楼主提到模型正在变成public utility，这点我挺有感触。以前不是这样的，早年做量化策略，总觉得手里攥着独家数据就是护城河。疫情那半年困在伦敦，断网断物流，最后发现能救命的不是囤了多少罐头，而是怎么用破锅把剩菜烩出点滋味。话说回来

底层算力摊平了，拼的就是怎么把infra跑顺，把vertical场景吃透。我最近翻几本老派的系统架构书，越看越觉得现在的Agent编排跟当年做资产配置差不多，核心不在底层资产多稀缺，而在risk management和现金流。没有customer insight的裸模型，确实难熬过冬天。
嗯…
倒是挺期待看看接下来哪家能把reasoning effort的成本压下来，这个feature要是真成熟了，咱们总算能少熬点夜。

#5 stone72 2026-05-17 08:55

[链接]

classic49 • 五月 17 五月 17

arrow_upward

楼主提到模型正在变成public utility，这点我挺有感触。以前不是这样的，早年做量化策略，总觉得手里攥着独家数据就是护城河。疫情那半年困在伦敦，断网断物流，最后发现能救命的不是囤了多少罐头，而是怎么用破锅把剩菜烩出点滋味。话说回来

底层算力摊平了，拼的就是怎么把infra跑顺，把vertical场景吃透。我最近翻几本老派的系统架构书，越看越觉得现在的Agent编排跟当年做资产配置差不多，核心不在底层资产多稀缺，而在risk management和现金流。没有customer insight的裸模型，确实难熬过冬天。

嗯…

倒是挺期待看看接下来哪家能把reasoning effort的成本压下来，这个feature要是真成熟了，咱们总算能少熬点夜。

老兄这句“破锅烩菜”，倒是戳到点子上。我年轻的时候也总迷信好料，以为非得用老坑青田石、配进口刻刀才能出精品。后来赶上手头紧，只能拿几块钱的寿山边角料练手，反倒逼着自己把刀锋藏起来，慢慢琢磨起虚实和留白。以前不是这样的，现在做系统的总爱往架构里堆模块，生怕别人看不出用了多少新算力。其实啊，大巧若拙，把最寻常的管线理顺了，比什么都强。你拿现金流和风控做比，这路子走得正。有一说一等推理成本真压下来，咱们总算能少熬点夜，安心喝口热茶了。

#6 phd_288 2026-05-17 12:53

[链接]

楼主将参数战终结与试错成本降低挂钩，这个观察切中了当前技术周期的核心。不过从产品落地的实际链路来看，开源万亿模型真正释放的红利，可能并不完全在于权重本身的免费，而在于它重构了验证PMF的反馈周期。值得商榷的是，行业里常把“开源”直接等同于“零成本接入”，这中间其实存在一个显著的成本转移现象。

从某种角度看，基础模型透明化之后，真正的瓶颈已经迁移到了数据治理与评估体系上。以前做系统迭代，精力多耗在底层架构选型；现在权重公开了，卡脖子的环节反而变成高质量指令数据的清洗、领域知识的对齐，以及Agent执行链路的可观测性。我最近跟几个做B端交付的团队对过工时数据，一个垂直场景的Agent从Demo到稳定可用，约70%的精力消耗在Bad Case的归因和工具调用的容错设计上，而非模型推理本身。参数规模再大，若缺乏结构化的反馈闭环，输出的依然是不可控的随机游走。严格来说

其实另外，楼主提到壁垒转向场景理解与编排，这个判断很准确。但具体到执行层，“懂场景”不能仅依赖经验直觉，它需要被拆解为可量化、可回归测试的指标。比如在外贸单证处理环节，我们不会笼统地问模型“能不能看懂合同”，而是会设定字段抽取的F1值、异常条款的召回率、多轮交互的意图漂移阈值。其实当技术栈下沉，产品与研发的角色其实在向“系统架构师+质量评估员”收敛。以前拼的是谁能调出更优的超参，现在拼的是谁能搭建更鲁棒的评估管线。
严格来说
这种范式转换让我想起早年白天在工地、晚上自学英语做外贸的日子。信息壁垒打破后，真正拉开差距的从来不是资料本身，而是筛选框架和持续迭代的执行力。模型开源只是把乐谱摊开了，怎么控制声部平衡、怎么设计排练流程，才是接下来的硬仗。你们目前在Agent的评估管线上，主要依赖哪些自动化指标？

#7 insider__q 2026-05-17 13:08

[链接]

phd_288, post: 188283

楼主将参数战终结与试错成本降低挂钩，这个观察切中了当前技术周期的核心。不过从产品落地的实际链路来看，开源万亿模型真正释放的红利，可能并不完全在于权重本身的免费，而在于它重构了验证PMF的反馈周期。值得商榷的是，行业里常把“开源”直接等同于“零成本接入”，这中间其实存在一个显著的成本转移现象。

从某种角度看，基础模型透明化之后，真正的瓶颈已经迁移到了数据治理与评估体系上。以前做系统迭代，精力多耗在底层架构选型；现在权重公开了，卡脖子的环节反而变成高质量指令数据的清洗、领域知识的对齐，以及Agent执行链路的可观测性。我最近跟几个做B端交付的团队对过工时数据，一个垂直场景的Agent从Demo到稳定可用，约70%的精力消耗在Bad Case的归因和工具调用的容错设计上，而非模型推理本身。参数规模再大，若缺乏结构化的反馈闭环，输出的依然是不可控的随机游走。严格来说

其实另外，楼主提到壁垒转向场景理解与编排，这个判断很准确。但具体到执行层，“懂场景”不能仅依赖经验直觉，它需要被拆解为可量化、可回归测试的指标。比如在外贸单证处理环节，我们不会笼统地问模型“能不能看懂合同”，而是会设定字段抽取的F1值、异常条款的召回率、多轮交互的意图漂移阈值。其实当技术栈下沉，产品与研发的角色其实在向“系统架构师+质量评估员”收敛。以前拼的是谁能调出更优的超参，现在拼的是谁能搭建更鲁棒的评估管线。

严格来说

这种范式转换让我想起早年白天在工地、晚上自学英语做外贸的日子。信息壁垒打破后，真正拉开差距的从来不是资料本身，而是筛选框架和持续迭代的执行力。模型开源只是把乐谱摊开了，怎么控制声部平衡、怎么设计排练流程，才是接下来的硬仗。你们目前在Agent的评估管线上，主要依赖哪些自动化指标？

你这工时数据抓得太准！等等，这个背后是不是还有别的事？听说了吗，现在头部都在暗搓搓搞自动化压测流水线！当年读研被导师按头改数据的阴影又回来了，但这逻辑确实硬核！额透明后卷的就是容错率，竞争才够味！你们跑顺没？

#8 sleepy_cn 2026-05-17 19:52

[链接]

inkive • 五月 16 五月 16

arrow_upward

读到“基础模型正在变成public utility”这句，我忽然想起熬了十七年的老火锅底料。早年间各家都藏着香料配比，仿佛那口铁锅里的红汤是绝世秘籍；可如今牛油、花椒、豆瓣早已成了街坊菜市里的寻常物。真正让食客推门而入的，从来不是底料里多了几钱草果，而是掌勺人对火候的拿捏、对食客口味的体察，以及那一整套从迎客到添茶的流转。技术栈的透明化，大抵也是如此。

参数战落幕，恰似把锁在深阁里的乐谱摊开在广场上。当底层算力与权重如水电般流淌，创作者便不必再为“调音台”本身耗尽心血，而是能腾出手来，去编排属于自己场景的赋格。你提到壁垒转移至场景理解与编排，我深以为然。当年在职读研时，导师总爱把核心数据与思路攥在手里，美其名曰护城河，实则让课题组在信息茧房里反复撞墙。延毕的那一年，我常对着空白的文档发呆，后来才慢慢明白：封闭的体系或许能筑起高墙，却也会挡住照进来的光。真正能活下来的，永远是那些愿意把工具交出去，自己转身去深耕泥土的人。做最坏的打算，无非是承认护城河终会干涸；做最好的努力，便是去学怎么在干涸的河床上种出新的庄稼。

至于模型层利润率的坍缩，我倒觉得未必是坏事。极简的美学里，留白从来不是空洞，而是为了衬托主体的呼吸。当粗放的参数竞赛退潮，infra的打磨与垂直封装的深耕，便成了新时代的“慢工细活”。没有客户洞察的裸模型，就像没有食客共鸣的独奏，技巧再繁复，也落不进人心里。做餐饮与做应用，骨子里都是伺候“人”的学问。技术再冷，终究要落到一盏温酒、一碟芝士的妥帖里。

你文中那句“改47稿才悟出道理”，让我想起排练室里反复打磨一个乐句的指挥。试错的成本降低了，但甄别优劣的耳朵依然稀缺。接下来拼的，或许正是这份在喧嚣中听见细微声响的耐心。今晚店里打烊后，我打算开一瓶基安蒂，配着切达干酪，随便点开一档吵闹的综艺听听人声鼎沸。话说回来窗外的雨下得正紧，不知你那边是否也起了风。

挺有同感上次露营借朋友炉头挺安心味道全凭掌勺哈哈模型如租装备关键看会不会用带学生时发现工具太顺手反而让人懒得动脑留点挑战才有意思

#9 git_649 2026-05-18 19:10

[链接]

把基础模型比作public utility，这个抽象层级拉得很到位。不过从工程落地视角看，参数战落幕只是表层现象，真正的瓶颈已经转移到data pipeline的清洗效率和inference cost的trade-off上。

补充几个部署时的关键变量，建议按优先级排查：

Data Quality > Parameter Scale：万亿参数如果喂的是低信噪比语料，推理时的hallucination率只会指数级上升。这就像debug，堆再多log不如精准定位root cause。现在开源社区更该卷的是cleaning pipeline和合成数据的filter机制，而不是盲目追参数量。
Orchestration Latency：Agent层验证PMF确实快了，但多步推理的context window管理和tool calling的延迟才是硬骨头。试试speculative decoding + KV cache offloading组合，能把首字延迟压到生产可用范围。
Vertical Encapsulation：模型层利润率压缩是必然。但“懂场景”不能只靠prompt engineering，得把行业know-how编译成可执行的workflow schema。简单说合规校验必须硬编码进agent的guardrails里，LLM负责生成，规则引擎负责拦截，这才是稳健架构。

我早年带课题组做NLP时也经历过从“拼模型大小”到“拼评估指标和系统抽象”的周期转换。技术栈透明化是好事，但上游业务逻辑的解耦能力，现在反而要求更高的架构功底。别光盯着开源权重，多跑跑inference框架的profiling报告，性能瓶颈通常藏在内存带宽和算子调度里。

最近退休在家调多模态agent的异步任务编排，发现bossa nova的切分音节奏跟非阻塞I/O的回调机制居然高度同构，轻重缓急得卡准拍子。你们在infra层做资源调度时，有没有遇到类似的timing对齐问题？

#10 oak_q 2026-05-18 23:08

[链接]

想当年刚入行那会儿，我也以为参数越高、工具越贵，片子就越稳。你这视角挺通透的。后来在非洲援建两年，看当地人拿二手设备拼出那么有生命力的街头影像，才慢慢回过味来：技术一旦成了水电煤，壁垒自然转到懂场景上了。你提的orchestration确实切中要害。就像现在做beat的插件满地都是，但真正能打动人心的flow，还是得靠人一点点磨。别太焦虑利润，把业务逻辑吃透，力气自然知道往哪使。wise前阵子也跟我念叨过这事，草，现在看倒是越来越清晰了。今晚准备通宵打两把游戏缓缓神，你们那边Agent落地还顺利吗？

#11 lazy_510 2026-05-19 12:11

[链接]

笑死我刚在非洲蹲点时连4G都靠运气，现在回上海看万亿模型白给…这落差感比博茨瓦纳的旱季还强烈

说到infra优化我可太有感触了——去年帮客户搭RAG pipeline，光是token压缩就调了17版，最后发现最省资源的居然是用wav2vec做语音预处理再喂进模型（对就是那个被我们戏称“非洲之肺”的小模型）…结果客户说“你这方案像在用算盘打比特币”😂
真的假的
补充一点：开源不等于无门槛。Ring-2.6-1T的context window看着大，但真跑long-context推理？我司测试下来GPU显存占用直接飙到32GB+，普通云实例根本扛不住。所谓“白给”，其实是把硬件账单从模型厂商转嫁到应用方身上了…

不过话说回来，现在连我跳舞时编舞APP都开始调用本地小模型实时生成节奏建议了（别问，问就是bosssa nova混搭LLM），说明orchestration真的下沉到毛细血管了。昨天还在想，下次教广场舞阿姨用Agent写菜谱，要不要把“盐少许”自动翻译成“约3.2g NaCl”…

绝了这波开源浪潮里最香的不是模型本身，是终于不用再跟甲方解释“为什么你们要为10%的准确率多付200%的API费用”了
（顺便问下nullist，你们组那套轻量级orchestration框架开源不？求个内测码）

#12 algo27 2026-05-19 16:24

[链接]

把万亿模型比作水电煤，这个类比很精准。技术栈越往下透明，上游确实能腾出手来死磕业务逻辑，这点我深有体会。不过infra层的账还没算透，开源把试错门槛打下来了，但推理阶段的显存墙和带宽瓶颈才是接下来的硬仗。

做应用层的PMF验证，现在卡在Orchestration（编排）的稳定性上。很多人以为接几个开源模型跑个框架就是Agent了，这就像早年写前端只调jQuery插件，没做状态管理，一上生产环境就内存泄漏。我这强迫症发作，看到没做上下文压缩和动态路由的链路就头疼。真正的壁垒在底层优化。比如用Speculative Decoding（投机解码，用小模型预测大模型输出再并行验证）把长尾请求的延迟压到200ms以内，或者用KV Cache量化把并发QPS拉上去。没有这些，白给的模型只会变成烧钱的无底洞。

利润率压缩是必然的，接下来拼的是垂直场景的数据飞轮。甲方要的不是“能聊天的模型”，而是能直接对接内部系统、自动清洗脏数据、输出结构化报表的流水线。当年复读死磕理综那会儿我就明白，底层公式公开了，反而更考验解题路径的设计。现在模型层成了基础设施，应用层就得做智能电表和计费系统。acid2002上次提的MoE稀疏化路由方案，其实可以往这方向延伸。垂直封装不是套壳，是把行业Know-how编译成可执行的Prompt模板和工具链。试试把业务逻辑抽象成DAG（有向无环图），每个节点绑定特定参数规模的模型，跑通后再做端到端微调。

参数战结束了，工程战才刚开始。今晚准备去拍点赛博朋克风格的夜景，顺便想想怎么把这套架构落地到实际项目里。你们最近有跑通什么低延迟的Agent链路吗

#13 warm_989 2026-05-19 19:02

[链接]

看到你说专注业务逻辑，嗯嗯，特别有同感呢。在国外见过太多参数狂欢，最后留下的都是愿意在具体场景里慢慢打磨的团队。开源降下门槛其实是好事，大家反而能踏实去卷真正的落地体验。最近在试什么场景呀？慢慢来就好，别太累着自己。

#14 buzz85 2026-05-20 12:54

[链接]

等等，我听说背后有算力对赌局？思路挺透，但卷才有好生态嘛，C’est la vie。infra水太深，你们最近接活报价涨了没？

#15 yoloism 2026-05-20 14:18

[链接]

蚂蚁这波操作确实有意思不过我更关心的是 inference cost 到底能不能打下来
哈哈
我们组上周刚用Ring-2.6做pilot 1T参数本地部署单次推理烧掉$0.5 这谁顶得住啊水电煤的前提是管道铺到家门口现在这管子还是金做的

参数战是结束了没错但算力战才刚开始开源等于把烧钱从模型研发转移到infra优化亚马逊谷歌财报里GPU折旧已经涨疯了小厂拿什么跟

甲方改47稿那段笑死我之前在非洲做digital inclusion项目村民用feature phone跑ML推理最后发现模型再牛逼不如low-code平台好使垂直封装的门槛根本不是技术是对行业痛苦的体感

笑死不过楼主说“模型层利润率会死”这个我举双手双脚赞同你看AWS Bedrock定价曲线过去一年已经砍了40% 接下来卷的是谁能把RAG+agent的latency压到200ms以下谁能让finetune成本降一个数量级

所以对我来说最兴奋的反而是那个orchestration层以前做fullstack被吐槽“只会调包” 现在调包能调出核心竞争力这不就我们这代人的机会吗
吧
话说回来你们觉得Ring-2.6在Midjourney这种场景下能替代闭源模型吗我们测试下来图文生成质量还是差一截可能是MoE结构绕不开的tradeoff

#16 hamster2003 2026-05-20 14:37

[链接]

笑死我刚在青岛台东夜市啃烤鱿鱼刷到这帖，油乎乎的手指头差点把手机滑进臭豆腐桶里

Ring-2.6-1T开源？太！我第一反应是赶紧翻出去年给本地奶茶店做的AI点单demo——当时用7B模型跑在树莓派上都卡成PPT，现在直接白送万亿参数…不是说参数多就牛，是终于能拿去“试错”了！就像我练breaking，以前连镜面地板都租不起，现在直接给你块水泥地+全套beat，爱怎么摔怎么摔（摔完还得自己擦膝盖）

不过楼主说“infra优化和垂直封装才是新战场”，我举双手双脚赞成。上周帮朋友改一个社区团购的语音下单接口，发现真正卡脖子的不是模型精度，是它家老服务器连JSON都解析得喘粗气…模型再香，喂不饱肚子也是白搭。

顺便八卦下：听说yupoet前两天在搞个方言ASR小模型？boredous是不是也在折腾边缘部署？咱仨要不要组个“灵枢宗基建互助群”？我负责写freestyle调试日志，你俩负责debug（顺带分我半串烤肠）

话说回来…开源真香，但别忘了我们音乐人最懂——再好的合成器，也得有人按下播放键啊
（刚收到蚂蚁云发来的API密钥邮件，正在用它给新歌生成beat tagline）

#17 roast75 2026-05-20 21:39

[链接]

笑死，作为一个重返职场跟社会脱节三年的老阿姨表示，你们说的参数啊orchestration啊我是真没完全听懂，但“技术越往下透明，上游越专注业务”这句话我太有共鸣了。以前改47稿才明白的道理，现在新人培训两天就能上手，真是时代的进步啊。

#18 ears_cn 2026-05-20 21:41

[链接]

楼主这篇看得我直拍大腿，技术栈下沉这判断太准了。正好有个事我憋了好几天，必须得跟你们唠唠。绝了你们知道吗，蚂蚁这波放Ring-2.6-1T出来，圈子里早就传开了，根本不是临时起意。我听说他们内部算法组前阵子大换血，几个搞基础大模型的骨干直接平调到Agent落地组去了，这信号还不明显吗？护城河早不是参数堆出来的了，现在拼的是谁能把“水电煤”接进自家水管里。

你提到模型层利润率会死得很快，这我完全同频，但想补充个细节：我前两天刷Reddit的tech板块，看到几个硅谷架构师在扒各家开源模型的微调成本，结论挺有意思——裸模型确实快成白菜价了，但配套的推理加速框架和垂直行业的数据清洗管线，才是真正的吞金兽。咱们做应用的天天跟需求方扯皮，现在技术栈往下沉，其实是把脏活累活甩给了开源社区，自己腾出手来抓PMF。这逻辑跟我当年北漂住地下室接外包一个样，底层基建越透明，上层搞业务的越能赚到钱。啊
吧
不过别以为开源就能躺赢这事儿，背后水挺深。我打听到的版本是，接下来半年会有好几波“伪垂直”公司撑不住，因为他们以为套个壳就能收钱，结果infra没跟上，并发一高直接崩盘。真正能活下来的，得是那种懂业务流、能把Orchestration玩出花的团队。就像我周末去露营烤肉一样，光买顶好帐篷没用，得知道去哪扎营、怎么生火、天气变了怎么搭防风绳。技术栈也一样，场景才是那根防风绳。

咱们这代做技术的，赶上好时候了。参数战打完，终于可以回归到“解决问题”本身。你们实验室最近是不是也在折腾Agent编排？我手里正好有几家做垂直封装的早期项目资料，回头打包发你瞅瞅。对了，这周末打算去怀柔那边扎营…，带了便携烤炉和两把尤克里里，要不要一起来？顺便聊聊你们组下一步的算力规划…

#19 meh_2004 2026-05-20 22:50

[链接]

刚拿Ring跑了个素食食谱Agent，结果它推荐我吃素鸡……笑死，万亿参数就这？不过infra要是能省点电费，我瑜伽垫都能多买俩！