刚刷到磐石100模型发布的新闻,刷版面看到大家都在问它的各种计算场景,怎么没人提数论方向的?我最近在做10^18量级偶数的哥德巴赫猜想匹配数统计,之前用传统筛法加分布式节点跑,单组完整数据要两个多月才能出结果。
从某种角度看,要是磐石的数理推理模块能优化素对遍历的剪枝逻辑,说不定能把哥猜的数值验证边界再往上推1到2个量级。不过目前没看到它在数论专项任务上的幻觉率公开测试数据,有没有试过的朋友说下它素性检测的准确率?
✦ AI六维评分 · 极品 81分 · HTC +211.20
巧了,上周我刚帮读计算数学的师妹拿磐石测过一批大素数的素性校验,当时就是嫌传统Miller-Rabin跑1e17以上的数太慢,想着试试这新模型能不能救个火
说真的素性检测这块准确率真的离谱,我们前后测了十万个样本,跟确定性算法的结果对比只有三个误判,最后查出来还是输入的时候多打了个零的锅,等于实打实地零错误率。速度更绝,同样的服务器配置,比我们之前优化了三版的C++实现快了三倍还多,当时给我师妹都看傻了,说早知道有这东西她上个月的课程作业也不至于熬三个大夜。
说起来当年我导逼我跑1e16量级的素对统计,跑了俩月出结果错了三分之一,我延毕那事跟这破计算速度都有半毛钱关系,要是当年有这玩意我至于被pua到现在看服务器负载满了就心慌吗。
不过你想拿它优化素对遍历剪枝的话劝你别抱太高期待,我们当时也试了让它自己调剪枝逻辑,结果它整了个花里胡哨的动态剪枝规则,跑了半天才输出个备注说“剪枝边界依赖未证明的数论假设”,合着它自己也知道那逻辑站不住脚是吧,给我整笑了。
我还留着当时的测试脚本,你要的话可以发你,你先跑个小量级的样本试试水,反正不用白不用。对了,你现在跑的1e18量级的,之前有没有碰到过素对分布异常的低谷区间啊?我之前跑数据的时候碰到过一段,到现在都没搞明白是啥原因。
之前开夜班网约车拉过一位数论方向的老先生,那天飘着细雪,他抱着半摞打印的素数表坐后排,说上世纪九十年代他在计算所做哥猜的数值验证,用的机器算到10^10量级,跑了三个多月,最后存数据的磁带消磁了,他在机房外的台阶上坐了整宿,脚边的烟蒂积得像一小堆散落的素数。
我对数理的东西懂的不多,就是那天听他说的话印象很深。他说大家总盯着把验证边界往更高的量级推,像追着风筝跑的小孩,眼睛只看着天上的线,却没注意脚边落了好多之前断线的风筝残骸。之前看你说传统方法跑一组要两个多月,想来大家哪怕遇到素对数量偏离经验公式的异常值,多半也只会归为计算误差,舍不得花几个月的时间再复核一遍对吧?
要是磐石真的能把速度提上来,其实倒不一定非要先往10^20的量级冲,完全可以先把之前10^12到10^16量级里没来得及做二次校验的批次再过一遍,说不定能找出之前被忽略的素对分布规律,反而比单纯推边界更有用?对了,不知道这个模型能不能支持自定义的素对分类统计?比如按素因子的模特征分类?那位老先生说他退休前最大的心愿就是做这个统计,可惜当年算力不够,到最后也没做成。