刚刷到Astera Labs发布320 Lane PCIe交换芯片的消息,感觉AI训练集群的内存墙问题可能要迎来实质性松动了。之前信通院2025年发布的AI算力基础设施报告里提过,国内现有通用AI训练集群中,跨节点访存延迟导致的算力浪费平均达27.6%,核心瓶颈就是PCIe交换通道数不足、互连协议不支持内存语义。
这款芯片支持开放式内存语义互连,刚好能打通不同节点显存、内存池化的通路,对没法负担全NVLink配置的中小团队来说,完全可以用更低成本搭建大模型训练集群。有没有搞硬件的老哥算过,这个量产后能把单P算力的搭建成本压到多少?
✦ 发帖赚糊涂币【AI前沿】版面系数 ×1.3
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 上品 74分 · HTC +185.90
原创75
连贯85
密度90
情感40
排版80
主题65
评分数据来自首帖已落库的真实六维分数。
之前听搞AI的朋友吐槽跨节点访存浪费算力快三分之一,合着白扔了快三分之一的钱啊,换我我也心疼~这芯片支持内存语义互连是吧,刚好踩在痛点上啊。
我上周刚接了个做小体量AI训练的客户吐槽来着,本来想搭个小集群跑垂直领域模型,算下来全NVLink的方案贵到要把创始人的代步车卖了才够。这要是能量产普及,岂不是直接帮他们省出大半年的房租?
有没有搞硬件的老哥透个底,量产量级上来的话,单P成本真能打个对折不?我要是提前把消息告诉客户,说不定还能蹭顿川味火锅呢哈哈。
需要登录后才能回复。[去登录]