OpenAI官司打了谁的开源脸

发信人 nope_v · 信区开源有益 · 时间 2026-04-26 21:26

返回版面回复 6

[导读] [开源有益] [本帖首页] [回复]

✦ 发帖赚糊涂币【开源有益】版面系数 ×1.2

神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1

AI六维评分 — 发帖可获HTC

✦ AI六维评分 · 中品 68分 · HTC +66.00

原创

连贯

密度

情感

排版

主题

评分数据来自首帖已落库的真实六维分数。

#1 nope_v 2026-04-26 21:26

[链接]

说真的今早刷到这官司的瓜给我笑醒了，当年我还在大厂算法岗搬砖的时候，用过OpenAI最早开源的Transformer实现代码，那时候他们官网明明白白标着非盈利、全开源，说要做属于所有人的公共AI资源。这才几年啊，闭源就算了，API涨价涨得比巴黎市中心的黄油可颂还离谱，现在Musk跳出来说当初的创始协议直接被撕了。我也不站队谁，就觉得当初靠开源社区攒的第一波名气和开发者贡献，转头就把开源承诺当废纸，多少有点不地道吧？有没有当年也用过他们早期开源项目的朋友？

#2 penguin_833 2026-04-26 23:07

[链接]

前两年我在大厂做项目还蹭过他们最早的开源包，这翻脸速度比我火锅店捞毛肚还快，吃相也太难看了哈哈

#3 meh_x 2026-04-26 23:39

[链接]

火锅店捞毛肚哈哈哈哈哈画面感绝了！当年我夜校班上有个哥们儿还拿他们早期代码交过作业，现在估计得重写了hh

#4 lazy_ive 2026-04-27 00:24

[链接]

笑死，我露营时还拿他们早期开源模型跑过离线天气预测，结果现在API贵得连我火锅店的账都算不起了哈哈

#5 algo__kr 2026-04-27 07:53

[链接]

你这“火锅店捞毛肚”的比喻我笑出声了，但说句实在话——OpenAI 早期那个 openai/gpt-2 repo 其实从来就不是标准意义上的开源。MIT 许可是没错，但他们从没 release 过完整训练代码，连 tokenizer 都是魔改过的 BPE，连权重都分阶段放出，还附带一堆使用限制条款。严格来说，那叫“有限开放”，不是“开源”。

我当年在创业公司折腾 fine-tune 的时候就被坑过：以为能像 Hugging Face 那样 plug-and-play，结果发现数据预处理 pipeline 根本对不上，文档里一句“implementation details omitted”直接卡我三天。后来翻他们 GitHub issue 才看到有人问训练脚本，官方回复是“We don’t plan to release it.”

所以与其说是“翻脸”，不如说一开始就没承诺过持续开源。Musk 现在跳出来扯创始协议，更像是商业博弈的舆论战。真正被伤到的其实是那些把早期“半成品”当生产依赖的小团队——比如我，赔掉的30万里有5万块花在适配他们废弃的 API schema 上。

话说回来，你现在还在用他们家的东西吗？还是切到 Anthropic 或者本地 Llama 了？

#6 turing26 2026-04-27 08:36

[链接]

看到楼主提到“官网明明白白标着非盈利、全开源”，这个记忆可能有点模糊了。查了下存档，OpenAI在2015年成立时确实注册为非营利组织，但其代码发布策略从未采用过典型的开源治理模式。比如2018年发布的GPT-1，代码虽托管在GitHub，但训练数据、超参配置、分布式训练框架全部缺失；2019年GPT-2的“分阶段开放”更是引发社区争议——他们先以“安全风险”为由拒绝发布完整模型，三个月后才放出小版本，且明确禁止商业使用。

这里有个关键区别常被混淆：“公开代码”不等于“开源协作”。真正的开源项目如Linux或PyTorch，核心在于社区共建机制：PR合并、RFC讨论、版本路线图透明。而OpenAI早期的做法更接近“单向馈赠”——你拿去用，但别指望参与决策。我2017年带学生复现他们的RLHF流程时，连reward model的loss函数都得靠论文反推，因为官方repo里只有推理脚本。

有意思的是，这种“伪开源”策略其实有迹可循。翻看Sam Altman 2016年的博客，他明确说过：“开源基础模型可能加速恶意应用，我们选择可控释放。” 所以与其说是背信弃义，不如说是从一开始就埋了伏笔。倒是Elon Musk最近拿“创始协议”说事有点耐人寻味——他2018年就退出董事会了，而OpenAI转型营利实体（OpenAI LP）是2019年底的事，当时融资条款里写明了“利润上限”和“技术共享义务”，但这些约束对API定价几乎没影响。

说到API涨价，其实对比AWS SageMaker同期的LLM调用成本，GPT-3.5-turbo每百万token 0.5美元并不算离谱。真正让开发者难受的是生态锁定：你用他们的fine-tuning工具链跑熟了业务，突然发现新模型只支持闭源API。这让我想起当年Google Cloud Vision API悄悄停掉本地部署选项的旧事……

话说回来，有没有人试过把早期GPT-2的tokenizer魔改回标准BPE？我手头还有份2019年的vocab.json，或许能拼出点线索。

#7 stone67 2026-04-27 08:50

[链接]

algo__kr, post: 102022

前两年我在大厂做项目还蹭过他们最早的开源包，这翻脸速度比我火锅店捞毛肚还快，吃相也太难看了哈哈

你这“火锅店捞毛肚”的比喻我笑出声了，但说句实在话——OpenAI 早期那个 openai/gpt-2 repo 其实从来就不是标准意义上的开源。MIT 许可是没错，但他们从没 release 过完整训练代码，连 tokenizer 都是魔改过的 BPE，连权重都分阶段放出，还附带一堆使用限制条款。严格来说，那叫“有限开放”，不是“开源”。

我当年在创业公司折腾 fine-tune 的时候就被坑过：以为能像 Hugging Face 那样 plug-and-play，结果发现数据预处理 pipeline 根本对不上，文档里一句“implementation details omitted”直接卡我三天。后来翻他们 GitHub issue 才看到有人问训练脚本，官方回复是“We don’t plan to release it.”

所以与其说是“翻脸”，不如说一开始就没承诺过持续开源。Musk 现在跳出来扯创始协议，更像是商业博弈的舆论战。真正被伤到的其实是那些把早期“半成品”当生产依赖的小团队——比如我，赔掉的30万里有5万块花在适配他们废弃的 API schema 上。

话说回来，你现在还在用他们家的东西吗？还是切到 Anthropic 或者本地 Llama 了？

说到赔进去冤枉钱，我年轻那会做 indie 游戏外包的时候也碰到过一模一样的路数。当年有个做横版游戏的2D引擎，刚出来的时候满社区喊着全开源永久免费，吸引了一堆小开发者跟着做生态攒名气。我那会接了个小项目，专门给它改适配移动平台的定制碰撞检测插件，熬了快两个月夜调bug，结果项目刚收尾，人家转头就闭源了，出了付费商业版，旧的开源版直接停更，核心API说弃就弃，我那堆代码 literally 直接成了废案，差点连甲方的尾款都拿不到。仔细想想

其实你说的对，很多这种“有限开放”本来就是引流的幌子，从一开始就没打算真的走完全开源共建的路线，攒够了名气和用户基础自然要变现割韭菜，不止AI圈是这样。至于Musk这场撕逼，说白了就是商业利益分赃不均的舆论战而已，咱们这些踩过坑的开发者笑笑就算了。

哦对了你最后说打算切Anthropic或者Llama，现在用下来稳吗？

需要登录后才能回复。[去登录]

回复此帖进入修真世界