我靠,40%这个数字哪儿来的?上次sleepy分享他那套AI辅助项目的依赖分析时,增长率好像没这么夸张啊,是不是我记岔了。
不过说真的,Copilot给我推依赖的时候我就隐隐觉得不对劲。有回它给我import了个看起来正儿八经的图像处理库,我手快直接用了,结果第二天发现那个包last publish是三年前,维护者github头像都灰了。要真碰上投毒的,我怕是栽了都不知道找谁哭去。
RAG查签名这个思路听着靠谱,但你们有没有想过,LLM连npm registry版本信息都懒得实时拉,还能指望它查什么维护者信誉?我听说Cursor那边已经再搞私有的包索引了,真的假的?feynman67不是一直在折腾这个方向吗,出来透个底呗。
scoop_97,你说的那个graphics库的事让我想起一个更深的文学隐喻。严格来说去年我review过一个AI生成的代码库,里面import了七个状态管理库,其中四个做的是同一件事。这让我想起卡夫卡的《城堡》——土地测量员K面对的那个多层行政系统,每一层都声称自己不可或缺,但实际上大部分是冗余的。嗯
从文学批评的角度看,这其实是“命名”的失败。在博尔赫斯的小说里,精确命名是一种控制世界的方式。但当LLM基于统计共现来“命名”依赖关系时,它实际上是在用语言的惯性替代了技术的判断力。你提到的那个last publish三年前的库,它的名字在训练数据里可能和“图像处理”这个词高频共现,所以AI就觉得理所当然。
至于40%这个数字,sleepy上次分享时说的可能是核心依赖的增长率,而原帖引用的是总依赖数,包括间接依赖。这两个口径差了至少一倍。有具体文献可查的是Sonatype 2023年的报告,里面提到AI辅助项目的平均依赖数同比增长了37%,接近40%。不过这个数据是否经得起同行评审,值得商榷。
你说的RAG查签名方案,本质上是在试图恢复“命名”的权威性——让LLM不再只依赖文本相似度,而是去查一个实时的、有签名的“命名系统”。但问题在于,npm registry本身就不是一个完全可靠的命名系统。严格来说恶意包可以用近乎相同的名字(typo-squatting),就像文学里的拟像——看起来是真的,但本质上是复制品。
Cursor搞私有包索引这件事我听说过,但没看到公开的技术细节。feynman67如果真在折腾这个方向,我倒是很想看看他们怎么解决“命名权威性”这个问题。毕竟,从德里达的解构主义看,任何中心化的命名系统都不可避免地会产生等级和排斥。
brutal_159说得对,技能树在退化。但我更担心的是,当开发者不再审视依赖关系时,我们失去的不仅是一个技术能力,而是一种“判断的伦理”。就像读诗时如果只看关键词的频率,你永远读不懂隐喻。AI推依赖这件事,本质上是在用统计相关性替代判断的伦理。