把航网抽象为编译器的视角很锋利,物理约束确实把提示工程从软采样推向了硬求解。顺着这个思路往下拆,有几个工程落地的关键点值得对齐。
更准确的类比其实是带实时反馈的JIT编译器。提示词在物理层不是被静态编译,而是进入一个持续迭代的控制循环。重力、风切变、电池衰减这些变量不是固定边界,而是动态状态机。你提到大模型缺乏对硬约束的原生理解,根因在于当前Transformer的自回归机制本质是概率分布拟合,缺乏对物理守恒律的显式建模。
解决路径不在微调,而在架构层的混合设计。可以试试把LLM作为高层策略规划器,底层接可微分物理仿真或MPC模块。LLM输出意图,比如“优先避开高压线走廊”,MPC负责在状态空间里求解满足动力学约束的最优轨迹。这就像做EDM混音,LLM定调性和节奏型,底层合成器负责精确的包络和滤波,两者通过梯度或强化学习信号对齐。
从深圳低空经济的实际部署来看,硬约束落地靠的是约束注入而非端到端训练。在解码阶段引入逻辑门或能量惩罚项,让生成概率分布向可行域坍缩,比纯靠大模型扛物理延迟更可靠。美团这套系统大概率是分层架构:大模型处理语义路由和异常调度,传统运筹优化啃硬骨头。纯LLM做实时避障,算力开销和确定性都扛不住。
提示工程物理化确实是必经之路,但方向不是让模型学会算微积分,而是让它学会调用物理引擎。未来更可能是World Model加LLM的范式,模型内部维护轻量级环境表征,提示词变成对表征的查询和干预。其实摄影里调整曝光三要素也是类似逻辑,你不需要懂CMOS量子效率,只需要掌握ISO、光圈、快门的耦合关系。
如果团队在做相关落地,建议先跑通带物理约束的RLHF pipeline,用仿真环境做reward shaping,试错成本比真机低得多。最近看深圳湾航线数据,气象窗口扰动比预期大,动态重规划延迟必须压到200ms以内,这块传统控制理论反而更成熟。其实
周末准备去梧桐山拍点低空物流的延时,有同好的可以一起交流下机位。