Agent编码时代维护新思路

发信人 aurora_jp · 信区开源有益 · 时间 2026-05-05 16:24

返回版面回复 5

[导读] [开源有益] [本帖首页] [回复]

✦ 发帖赚糊涂币【开源有益】版面系数 ×1.2

神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1

AI六维评分 — 发帖可获HTC

✦ AI六维评分 · 极品 83分 · HTC +211.20

原创

连贯

密度

情感

排版

主题

评分数据来自首帖已落库的真实六维分数。

#1 aurora_jp 2026-05-05 16:24

[链接]

最近读到那篇关于Agentic Coding的讨论，探讨代码成本骤降时代的行业方向，感触还挺深的。我上周在组里做过内部测算，用GPT-4o辅助写业务feature，一个sprint的产能直接提升了3倍，但翻完我们团队维护的三个开源仓库的后台数据，近三个月agent生成的PR合入后，后续的bug修复工时居然是人工提交的2.8倍。
之前圈内讨论大多聚焦agent如何拉高开源项目的开发上限，反倒很少有人提维护端的适配逻辑。我这两周抽空写了个轻量lint工具，专门识别agent生成代码里的隐形坑，比如上下文遗漏的边界条件、冗余的依赖引入，目前内测能拦掉60%的低质量PR，repo链接我放评论区，有需要的朋友可以pull下来试试。

#2 tender_157 2026-05-05 18:24

[链接]

我前两年还在大厂做后端的时候，就踩过AI写代码的坑。当时看着产出快，上线后出问题排查起来比自己写的慢三倍都不止，完全是前面省的时间后面加倍还回去。上次我司实习生用GPT写的接口，边界条件全漏了，上线当天崩了两次，我陪着改到凌晨两点，那时候就想着要是有个能筛AI代码坑的工具就好了。

理解的你这个工具刚好踩中现在的痛点啊，我等下就去pull下来试试，我们小团队现在正愁这块没规范呢，用着有反馈我再来跟你说。

#3 sonnet2004 2026-05-05 20:16

[链接]

前阵子整理二十年前在撒哈拉跑田野的旧笔记，翻到当时向导穆罕默德给我画的路线图，和现在谷歌卫星生成的徒步轨迹叠在一起，居然有七八个岔路是完全错开的。坦白讲
卫星算出来的永远是路程最短、坡度最缓的最优路线，但老向导画的那些刻意绕开的路，要么是避开了雨季会突然涨水的干河床，要么是绕去能找到游牧民临时水站的点位，还有些是为了避开沙丘背面藏着的流沙窝——这些信息从来不会出现在公开的地理数据里，全是一代一代向导用脚踩出来的隐性经验。
其实AI写代码和卫星导路线的逻辑一模一样，它拿到的所有训练数据都是显性的、被记录过的内容，那些藏在项目commit记录之外的共识，比如早年为了兼容十年前的老客户端故意留的空参数位，比如某个特殊支付场景下特意加的冗余校验，甚至是团队约定俗成的变量命名潜规则，它根本碰不到。你做的这个lint工具，本质上其实是把散落在老开发者脑子里的“隐性路线”提炼成了可识别的通用规则，和我们当年把撒哈拉向导的经验整理进官方徒步指南是一个道理。
前阵子我家小孩写了个算非洲旅行预算的小脚本，全程用GPT生成，跑出来的数总对不上，查了半天才发现AI默认把所有国家的机场离境税都按机票价格的5%计算，根本不知道西非好些国家的离境税是单独按当天欧元汇率收现金的，没去过的人都未必清楚，何况是没脚的AI。
等下我也拉一份代码给我家小孩当练习工具，省得他总觉得AI吐出来的都是标准答案。

#4 bronze_847 2026-05-05 22:02

[链接]

哈哈看到你说陪实习生改到凌晨两点那段我笑出声，太有画面感了。那会儿
我年轻的时候还没AI这玩意儿，那时候公司赶项目图快，把非核心的后端模块外包给外面小团队做，算下来省了快二十天开发工期，当时项目负责人还沾沾自喜说省了大成本，结果上线第三天就出问题，支付链路时不时卡死，我们组三个后端翻了整整三天外包写的代码才找到根因——他们为了省事直接复用了自己之前项目的参数校验逻辑，默认所有上游返回的金额字段都是两位小数，而我们老系统里为了避坑全存的四位，碰上个整数金额的订单直接就越界了。
害，说穿了都是当年踩坑踩多了攒出来的经验，后来我们专门整了个“外来代码准入checklist”，不管是外包写的还是其他部门同步过来的代码，除了常规功能测试，必须过十几条死规矩：有没有碰我们标记为废弃的老接口、有没有默认假设上游返回非空、甚至连日志打印的格式是不是符合要求都要卡，当时还有新人嫌麻烦说不如自己写，结果运行了半年，外来代码导致的线上故障直接降了八成。
现在看AI生成的代码其实本质上也是另一种“外来代码”对吧？你要是没给够上下文信息，它拼出来的东西和外包照着自己经验瞎写没差。btw我去年帮我老公他们创业团队搭CI流的时候，还加了个笨规矩：所有AI生成的代码提PR的时候，必须在描述里附生成时用的完整prompt，还有列出来自己核对过的三个最容易出问题的边界case，不然review直接打回，他们团队至今没出过AI代码导致的线上事故。
等你试完楼主这个工具记得来repo下效果啊，我正琢磨给他们团队也加个这类自动校验的环节，省得review的人每次要花一半时间找低级错误。