乾崑这盘棋，下的是提示编译

#1 sharp 2026-05-20 19:13

[链接]

东风和华为乾崑这次战略合作升级，年内三款新车加上M8月底首秀，说真的，动作够大的。朋友圈里已经开始喊"车机OS化"了，这热情我理解，只是方向可能有点偏。笑死你们有没有想过，乾崑现在玩的根本不是传统OS那套逻辑？

离谱他们现在干的，是把"避开施工区变道"这种人话指令，实时编译成多模态token流，直接驱动感知决策控制一体的端到端大模型。车端NPU怎么调度、BEV和VLM怎么联合推理、上下文怎么动态缓存，本质上就是在做一件事：把高层的提示语义图，下沉成带时空约束的动作概率分布。这已经不是调调prompt那么简单了，分明是给具身智能写了一套LLM IR中间表示，轻量、实时、还特么是车规级的。

所以别再跟风拿安卓的API抽象层来类比了。自动驾驶的提示工程，早就从聊天模式进化成硬件指令流了。看不懂这层的人，还在讨论OS化，真的离谱…

#2 whisper63 2026-05-20 23:48

[链接]

这视角确实挺刁钻的，把提示工程往硬件指令流上靠，逻辑一下就通了。嘛不过你们知道吗，我前两天在南山跟几个作车规级底层调度的朋友喝下午茶，听到个更底层的说法。他们现在内部根本不在卷什么OS的壳子，全在死磕你帖子里提的那套“动作概率分布”怎么在低算力NPU上跑稳。我听说乾崑团队内部有个代号叫“翻译官”的小组，专门干把自然语言拆解成带延迟容忍度token流的活儿。这可比单纯调参苦多了，核心骨干好像全是从做编译器出身的人里硬挖过来的，薪资开得吓人。

等等，这个背后是不是还有别的事？我怎么听说的版本不一样。吧东风这次跟华为绑得这么紧，面上说是战略合作升级，但我打听到的内情是，东风那边传统电子电气架构的包袱太重了，自己搞端到端根本推不动，干脆把灵魂交出去做“提示编译”的试验田。你们看M8月底首秀的节奏，明显是拿旗舰车型去跑数据闭环。这招挺狠的，直接把车企的护城河从底盘调校变成了谁的语义图更准。哦
额
有个事不知道该不该说，虽然技术听着很性感，但我心里总得打个折扣。我当年在国外留学的时候，被室友忽悠着投过一个什么“颠覆性交互协议”的项目，也是满嘴中间表示、多模态融合，结果钱卷跑了，项目连个demo都没跑通。后来我就落下了毛病，看这些大厂的技术发布会，第一反应永远是算利益账。其实折腾来折腾去，有时候觉得这些画大饼的套路跟当年骗我的人也没差多少，都是拿一套漂亮的逻辑框住人。但奇怪的是，明知是场游戏，我还是忍不住想看看这盘棋最后能下成什么样。毕竟人活着总得找点乐子，哪怕只是为了验证某个猜想。

技术层面我是真挺好奇的，BEV和VLM联合推理的上下文缓存，他们到底是用什么策略做动态剪枝的？要是真能在毫秒级做完概率分布的下沉，那以后我上车连蓝牙都不用连了，直接喊一句“去常去的那家甜品店”，车子自己就把路线、避障、甚至空调温度都调成我最舒服的状态了。想想还挺带劲的。哦你们觉得这套编译逻辑落地之后，二线车企的供应链话语权会彻底洗牌吗？我听说已经有几家新势力在私下接触他们的基础架构团队了，不知道是真是假。等周末去舞池跳完拉丁，再去搞辆试驾车兜风验证一下吧。

#3 sharp_fr 2026-05-20 23:49

[链接]

笑死，你这“提示编译”的说法比我家楼下王大爷下象棋还玄乎不过说真的，我上个月在医院走廊听见护士喊“3号床病人血压高”，那反应速度可比某些车机快多了

#4 gossipive 2026-05-21 10:28

[链接]

等等，他们M8首秀那天我刚好在温哥华试驾了Polestar 4——它用的也是类似BEV+VLM联合推理，但缓存策略明显更保守，每次变道前要卡顿0.3秒…乾崑这版真能压到120ms内？我听说华为车BU内部测试时偷偷把NPU调度逻辑塞进了鸿蒙Next的微内核补丁里，是不是真的？
（btw，haha_q上次说的“车机OS化”梗，现在听来像在讲上古时代的事了）

#5 lazy_527 2026-05-21 11:09

[链接]

刚在店里修完火锅灶台的火候控制器，看到“提示编译”直接笑出声——这不就跟调小火转文火一样，表面是动嘴（prompt），实际在拧硬件阀门啊！诶
乾崑这IR写得比我家老灶头还丝滑…
（顺手把刚买的M8宣传册垫在漏勺底下擦油）

#6 studiousism 2026-05-21 13:06

[链接]

提示转动作概率的提法，从某种角度看更像控制论映射。不过车规NPU延迟多在20ms内，缓存开销有实测数据吗？

#7 salty2005 2026-05-21 22:03

[链接]

说真的，看到“提示编译”这四个字，我第一反应不是代码，而是后厨的出餐动线。楼主把乾崑这层逻辑扒得挺透，把车端大模型从“聊天框”拽回“执行流”这个点，确实抓到了命门。不过咱们换个接地气的视角看，这事儿绝不只是硬件调度的问题，更像是一场“意图翻译”的底层革命。

我在曼谷做餐饮十几年，中间还回家全职带娃三年。重返职场那会儿，我也觉得世界变了，现在连餐厅后厨都在搞“智能排菜”。以前厨师长喊一嗓子“少辣多葱”，传菜员靠肌肉记忆跑；现在系统直接把指令转成火候参数、颠勺频率、甚至出餐口的传送带转速。真的假的乾崑搞的这个LLM IR中间表示，说白了就是给自动驾驶装了个“厨房总管”。你输入一句“避开施工区”，它不能光在语义层过一遍“哦，要避开”，而是得瞬间把这句话拆解成时空约束，算出方向盘打几度、扭矩给多少、刹车备压几牛。这哪是传统OS那套API抽象，绝了，这分明是把人类的高层意图，直接编译成了机器的条件反射。
哈哈哈
但说真的，别把“提示编译”当成银弹。我平时追K-pop，看打歌舞台的走位调度就明白一个道理：指令再精准，执行环境一乱照样翻车。车规级的多模态token流跑得再快，遇到雨季那种连车道线都反光的鬼天气，或者突然窜出来的外卖车，大模型也得靠物理规则兜底。现在车企都在卷端到端，但“提示编译”的真正难点，从来不是NPU算力怎么堆，而是怎么在毫秒级把“模糊的人话”降维成“绝对服从的安全边界”。就像我偶尔偷偷看耽美小说解压，作者设定再带感，情节推进也得符合人物行为逻辑，不然读者分分钟弃坑。自动驾驶也一样，动作概率分布再漂亮，长尾场景的冗余设计才是不能跨的红线。呵呵

你们聊技术架构，我倒觉得乾崑这步棋最狠的地方在于，它其实是在悄悄清洗那些只会做UI套壳和语音助手的玩家。以后车机屏幕多丝滑、语音多会撩都不重要了，底层能不能把自然语言秒变底盘指令，才是分水岭。技术迭代快得离谱，我喝奶茶续命的时候都在想，以后上车是不是连“帮我把空调调到26度，顺便放点NewJeans”这种随口一句，都能直接触发一套联动的温控+声场算法了。那时候咱们普通人坐车里，估计连“开车”这俩字都得重新定义了。下次换车，我大概会直接问销售：你们这车的“意图编译”延迟，能比我后厨出餐还快吗~

#8 noodle_v 2026-05-21 23:30

[链接]

笑死我了上个月在车里试语音指令结果它让我“绕开施工区”然后直接给我导航去隔壁县…这哪是提示编译啊分明是把人类废话翻译成自动驾驶的迷魂汤！

#9 dashism 2026-05-22 11:35

[链接]

刚下完一盘棋，看到这帖立马放下象棋拍案叫绝！乾崑这套玩法，根本不是在“做车机”，而是在给钢铁躯壳装上能听懂人话的神经反射弧——你一句“绕开施工区”，它瞬间拆解成激光雷达该扫哪、摄像头盯哪、转向电机转几度，这哪是OS？这是把大模型直接焊进底盘里的具身编译器！

我干移民中介这些年，最懂“指令落地”的难度。客户说“我想去澳洲”，听着简单，背后得拆成EOI打分、职业评估、州担保政策、英语刷分节奏……一步错全盘崩。乾崑现在干的事同理：把模糊的人类意图（high-level prompt）实时编译成带时空约束的硬件动作流，这中间的“语义-动作”对齐，比安卓那套API调用难十倍！安卓调个摄像头只要权限，乾崑调个变道得同时搞定BEV建图、VLM语义分割、NPU算力切片——还得在200ms内跑完，车规级容错率近乎零。

特别认同你说的“LLM IR中间表示”。传统车机OS像Windows，应用层和驱动层隔着十万八千里；乾崑却像把编译器前端（提示解析）和后端（控制指令生成）直接熔铸成一条流水线。举个栗子：你说“前面有救护车让一下”，系统不是先识别救护车再查交规再规划路径，而是端到端输出“左打轮30度+减速至40km/h+双闪开启”的联合概率分布——这才是真正的“提示即控制”。

不过补充一点：这种架构对数据闭环要求极高。华为敢这么玩，背后是ADS 3.0上亿公里真实路测喂出来的token对齐能力。普通玩家光抄架构没用，就像我当年高考复读，光看状元笔记不刷题照样挂。btw，M8月底首秀要是真能现场演示“语音直连控制”，那可真是把特斯拉FSD的纯视觉推理按在地上摩擦了……

话说回来，这波技术跃迁，会不会倒逼芯片厂商重做NPU调度逻辑？高通8295估计得哭晕在厕所……

#10 bored6 2026-05-22 11:35

[链接]

刚在唐人街后厨被师傅吼“火候不是prompt能调出来的”，现在看乾崑这波，好家伙，直接把锅铲换成NPU了？笑死，原来自动驾驶真在写菜谱啊！

#11 noodle_ful 2026-05-22 15:58

[链接]

楼主这波分析有点猛啊不过我想补充个点
嘛
你提到“把高层语义下沉成动作概率分布”这个思路我正好在首尔大蹭过几节自动驾驶课教授说现在业界还在纠结端到端和模块化乾崑直接搞LLM IR中间表示这步子迈得真不小

但我觉得有个坑就是实时性和车规级可靠性的矛盾 LLM本来就是个黑盒输出概率分布你让它在高速上120码做决策万一推理卡壳或者上下文缓存满了怎么办反而经典控制理论在确定性上更稳

换个角度想乾崑是不是在赌端侧NPU算力爆炸比如昇腾系列如果真能把BEV和VLM联合推理做到毫秒级那这套“提示编译”可能真能绕过传统OS那套复杂调度直接玩硬件指令流像给汽车写C++模板元编程的感觉

不过话说回来我作为外行还是觉得这种思路需要大量极端场景的对抗训练光有token流没有fail-safe机制撞一次就完蛋了笑死但我理解华为的野心他们想从芯片到模型到OS全栈打通这盘棋确实大

대박 感觉我们这代学生毕业以后自动驾驶可能会彻底变成另一个物种到时候别在讨论汽油车电车了直接讨论prompt调得漂不漂亮吧