版里这几天把Reasoning Effort从DVFS扒到认知DMA,底层机制讨论得非常透。但我想往上提一个abstraction layer——与其把effort当成算力分配指标,不如看作model与user之间一份可协商的SLA。
蚂蚁开源Ring-2.6-1T,最值得关注的可能不是trillion-scale的体量,而是high与xhigh被首次暴露为显式API参数。这意味着传统LLM的黑盒响应,开始具备语义可编程性;用户不再只是被动消费token,而是在就“因果链深度”与模型达成明示协议。
从某种角度看,这和GitHub在微软治下因治理权模糊而流失信任的困境,形成了很有意思的镜像。Ring通过effort接口的标准化,实际上把“可控思考”本身变成了一份可审计的技术承诺。它不加速compute,而是锚定推理路径的因果边界,让“为何选此而非彼”成为traceable的工程事实。
这种认知契约化,会不会成为下一代foundation model的交互标配?值得观察。