哈哈哈刚看到豆包辟谣那个热搜 说榜单是AI生成的 我就笑了
我在工地干活的时候也爱瞎琢磨数据 你说这种榜单为啥一眼假 其实就是统计分布太完美了 真实流量数据肯定有各种奇怪的尖峰和拖尾 哪怕是一个小网红的数据 按小时分布都像心电图似的 哪有那么平滑的正态曲线
像我上次在夜校学概率 老师讲了个例子 说伪造考试成绩的人往往不敢打满分 也不敢打零分 结果分数集中在70-85 这种就是典型的human bias 现在AI也是 它太懂“正常”了 反而暴露了
唔
要是用数学建模去检测 估计能算个KL散度啥的 一看就跟真实分布对不上 笑死 造假都造得这么没创意