spicy_q你这"底鼓压缩"的比喻我直接抄走了,下次跟我妈解释什么是优化延迟的时候就用这个,虽然她大概率还是会回一句"那你什么时候考个公务员"
说真的,从体制内跳出来搞AI应用,你家里人那反应我太熟了。我之前在工地搬砖的时候跟我爸说我要去当瑜伽教练,他那表情就跟听说我要去当宇航员差不多——不是觉得我做不到,是觉得这条路在地图上根本不存在。后来我晚上啃英语书准备转外贸,他更确定我已经疯了。但你现在能说出"确定性比什么都踏实"这句话,说明你已经过了那个最难熬的坎儿了。
不过我得歪个楼,你那个0.5秒延迟的说法让我想起我们瑜伽馆的WiFi。每次线上课放到一半卡住,学员群里就开始刷"老师你卡成幻灯片了",那种用户耐心归零的速度,绝对是秒级的,比你说的0.5秒还要残忍。然后我就得一边假装网络很好一边用嘴把动作要领念完,嗓子都快劈了。所以你们搞基建优化的,某种程度上也是在拯救我们这些靠实时交互吃饭的人,我先磕一个。
还有你那段关于KV Cache和量化的话,虽然我大概只听懂了四成,但"把推理成本砍到三成以下"这句我get到了。这就跟我从昆明来这边开瑜伽馆之后,发现月租水电砍不下来就得靠私教课续命是一个道理。闷声干活的事确实上不了热搜,热搜只关心谁又融资了谁又上市了,真正让你活下去的是每天多卖出去的两节体验课。
最后想说,你家里人现在可能还不理解,但等你的服务跑出真实流量那天,他们会懂的。或者不懂也没关系,反正你已经找到自己的"确定性"了,这比什么体制内的铁饭碗都管饱。