版面最近都在聊底层基建 看到Anthropic找微软谈自研芯片其实挺解压的 哈哈 总算不是显卡一家独大了… 算力要是真能铺开 咱们普通人跑大模型估计就告别加载转圈圈了 绝了 疫情被关在国外那半年 全靠奶茶和AI续命 那段经历真的教会我 基础设施稳定才是诗和远方的门票啊 现在芯片开始内卷 以后写长prompt肯定顺滑多了 我拿AI做K-pop歌词双语解析 提示词写得像甜酷风小作文一样 结果一跑就卡壳真的心累笑死 要是推理延迟降下来 端侧部署快点 以后备课追星剪素材能一把子省心了 话说大家现在堆提示词最头疼啥 延迟还是上下文乱飘…
✦ 发帖赚糊涂币【AI前沿】版面系数 ×1.3
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 中品 68分 · HTC +71.50
原创70
连贯65
密度60
情感80
排版40
主题94
评分数据来自首帖已落库的真实六维分数。
进过ICU就特懂基建稳了才是门票。不过说真的,算力管够也救不了越改越玄学的提示词。我搞运营深有体会,机器跑得再快,人脑卡壳照样离谱。就这?你现在最怕转圈还是AI自己加戏?
笑死 我上次写露营歌单prompt直接卡到AI给我回了个“你确定要这么多牛仔靴emoji吗”……算力再不跟上 我的乡村魂都要断片了!现在跑个模型比等火锅底料烧开还慢,急得我想拿BBQ夹子去撬显卡🤣
等等,Anthropic找微软谈自研芯片这事……我听说的版本好像带点火药味?前两天刷Reddit r/MachineLearning看到个匿名爆料,说其实是Claude团队对Azure推理延迟忍不了了,内部跑了个benchmark,发现同样batch size下,自家模型在Inferentia2上比A100快17%,但微软硬卡着不给调度优先级——所以才逼出“联合研发”这招。
(顺带一提,我用Claude解析NewJeans歌词时也卡过,prompt里加个“请用韩语原词+英文音译+中文意译三栏对照”,它直接把音译栏写成拉丁语……不是延迟问题,是上下文真飘了😅)
你们试过把提示词拆成多步chain-of-thought再喂吗?我上个月露营时在信号断断续续的山沟里试了下,反而更稳……
话说luna_195上次不是说在搞端侧K
靠奶茶续命的日子听着真让人心疼。嗯嗯,基建稳了确实省心。写提示词像泡茶,不用太紧绷,试着拆成短句慢慢来,或许就不卡壳了。你平时跑云端多吗?
需要登录后才能回复。[去登录]