订阅
纠错
加入自媒体

OpenAl终于出手!官宣开源新模型,这次是摸着 Deepseek过河

2025-04-02 17:17
智渊览界
关注

编辑:Yuki | ID:YukiYuki1108

在暗示推出一款开源模型的一个多月后(2025年4月1日),OpenAI CEO山姆·奥特曼(Sam Altman)在社交平台X上正式宣布:OpenAI计划在未来几个月内发布一款具备推理能力的“开放权重”(open-weight)大模型。这一消息迅速引发了科技媒体和行业观察者的广泛关注。许多中文媒体以“OpenAI预告/即将发布开源模型”为标题进行报道;一些业内人士则将其视为OpenAI重新走向开源的标志性一步

然而,“开放权重”是否等同于“开源”?这一问题的答案并不简单。从OpenAI的措辞

到行业实践,“开放权重”与“开源”之间存在着显著差异。本文将深入探讨这一话题。

一、“开放权重”与“开源”:概念辨析

首先需要明确的是,“开放权重”(open-weight)与“开源”(open-source)是两个不同的概念。

“开放权重”:指的是在模型训练完成后公开其参数(weights),允许开发者基于这些参数进行部署、测试甚至微调。然而,“开放权重”并不包括训练数据完整训练代码明确的使用权限。这意味着开发者可以利用这些参数进行本地部署和推理服务(如对话生成或文本分类),但无法复现完整的训练过程或完全自由地修改模型的底层架构。

“开源”:则是一个更广泛的概念。它不仅包括代码公开(如训练代码和推理代码),还可能涉及训练数据方法透明性以及使用权限的自由度。开源的核心理念是全面透明自由使用

从这个角度来看,“开放权重”更像是开源的一个子集——它降低了模型的使用门槛(如本地部署和微调),但无法满足真正的可验证性可重现性需求。

二、行业实践:“开放权重”已成为主流

尽管“开放权重”与“开源”存在差异(如缺少训练数据和完整

训练代码),但从行业实践来看,“开放权重”已经成为当前大模型的主流模式

以DeepSeek、Qwen(阿里)和LLaMA(Meta)为例:

DeepSeek:其V2、V3和R1等系列均采用了“开放权重”策略。此外DeepSeek还提供了技术报告并采用了限制极少的MIT开源协议——允许任何人自由地使用、修改、分发和商业化软件或模型。

Qwen(阿里):Qwen系列不仅公开了权重还采用了Apache2.0协议——允许用户自由地使用修改分发代码包括商业用途仅要求保留原始版权声明许可声明。

LLaMA(Meta):虽然LLaMA系列也公开了参数推理脚本但其使用协议限制更多从LLaMA2开始Meta采用了更宽松许可证(LLaMA3又更开放了一点)但仍需申请使用且不能直接用于某些商业应用发布服务导致其落地场景受限。

这些案例表明尽管三者都自称“开源”,但如果将“开源”拆解为几个维度来看——如是否公开完整训练数据是否提供可复现训练代码等——你会发现没有一家是真正意义上做到全开。

三、“o3-mini级别”:OpenAI新模型的定位

根据Sam Altman在今年2月的暗示以及最新推文中提到的“powerful new open-weight model with reasoning”,可以推测出OpenAI在开源路线上最终选择了一个“o3-mini级别”的推理型大语言来打开局面。

所谓“o3-mini级别”,指的是具备较强推理能力且适合轻量化部署的中小型大语言——这类既能够满足企业级应用需求又能够降低硬件成本使其成为当前市场上最受欢迎类型之一。

四、“重返”还是“妥协”?

对于OpenAI来说这次重返社区意义远不止发布那么简单过去两年间Meta Mistral Qwen DeepSeek轮番上场一边打造一边打造生态甚至逐渐形成规模庞大生态尤其在DeepSeek-V3/R1之后越来越多硬件软件厂商加入其中使得整个行业格局发生显著变化而作为曾经引领者却因闭源策略逐渐被边缘化因此这次部分回归可以看作是对竞争压力回应同时也是对自身定位调整。

五、“真开”还是“假开”?

尽管很多人以为是以起家但实际上至少在GPT-2时期就有了闭源路线打算2019年初GPT-2发布开始以恶意使用风险名义拒绝公开但在外界一致认为夸大风险舆论下才在年底公开满血版15亿参数GPT-2不论如何从GPT-3开始彻底走上闭源路线不再公开权重代码或训练数据因此这一次重新也可以视为对社区释放信号但需要明确是从Sam Altman采用字眼来看大概率将和今天DeepSeek Qwen LLaMA一样:

优点:降低门槛支持本地部署微调适配缺点:无法复现完整过程难以满足真正需求

       原文标题 : OpenAl终于出手!官宣开源新模型,这次是摸着 Deepseek过河

声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

    扫码关注公众号
    OFweek人工智能网
    获取更多精彩内容
    文章纠错
    x
    *文字标题:
    *纠错内容:
    联系邮箱:
    *验 证 码:

    粤公网安备 44030502002758号