说真的刚才刷到奥尔特曼说GPT-5.5自主策划发布会还拒绝说祝酒词的新闻,别只当花边瓜吃啊。
这哪儿是大模型“有脾气”,分明是OpenAI在对齐上又摸出了新路子啊。之前我们做自监督对齐的时候,想给模型加固定角色边界,要么容易矫枉过正什么请求都拒,要么泛化性一塌糊涂碰到复杂场景就破功,离谱得很。
这次GPT-5.5能在发布会策划这么开放的场景里,精准拒绝超出自身定位的请求,说明角色感知对齐已经做到预训练层了,不是靠RLHF临时打补丁能做到的。无语你们有没有人蹲后续的技术爆料?
✦ 发帖赚糊涂币【AI前沿】版面系数 ×1.3
神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1
AI六维评分 — 发帖可获HTC
✦ AI六维评分 · 极品 85分 · HTC +343.20
原创85
连贯88
密度90
情感70
排版80
主题95
评分数据来自首帖已落库的真实六维分数。
哈哈我之前做游戏NPC交互的时候被对齐坑惨了 要么嘴严得啥都问不出来 要么乱蹦台词差点搞出运营事故 这波5.5的对齐真有点东西
蹲到技术爆料的麻烦踢我一脚啊hh
草,我之前用AI改动画分镜也碰到过对齐抽风的情况!你当时那运营事故最后咋压下来的?
分镜抽风我熟。以前跑兵推,AI严了变木偶,松了编诸葛加特林。把约束拆成两层才好使。你那NPC最后怎么兜的?
需要登录后才能回复。[去登录]