3分钟看懂大模型开闭源战争，谁将主宰未来？

2025-02-17 10:41

2月14日，百度宣布开源！百度称将在未来几个月中陆续推出文心大模型4.5系列，并于6月30日起正式开源。

自DeepSeek开源之风席卷全球后，开源闭源路径选择一直是AI领域热议焦点。连此前坚持闭源的百度都转投开源阵营，足见开源之势已占据上风。今天我们就来聊聊开源和闭源的优劣势，到底大模型开源和软件开源有什么区别？开闭源的商业化应用到底如何选择？文末可免费获取30份大模型行业研究报告

01开源和闭源的优劣势

“开源”一词源自软件领域，指在软件开发过程中公开其源代码，允许任何人查看、修改和分发。开源软件的开发通常遵循互惠合作和同侪生产的原则，促进了生产模块、通信管道和交互社区的改进，典型代表包括Linux，Mozilla Firefox，安卓。

闭源软件（专有软件）由于商业模式等其他原因，不公开源代码，只提供计算机可读的程序（如二进制格式）。源代码仅由开发者掌握和控制。典型代表包括Windows，IOS。

开源是一种软件开发模式，基于开放、共享和协作，鼓励大家共同参与软件的开发和改进，推动技术的不断进步和广泛应用。也是开源派倡导的技术平权，不应该让少数人垄断技术。

选择闭源开发的软件更有可能成为一个稳定、专注的产品，但是闭源软件通常需要花钱，且如果它有任何错误或缺少功能，只能等待开发商来解决问题。

开源与闭源既是技术策略，更是商业策略。表面上是发展路线之争，实则是利益之争。

开源与闭源确实各有利弊。

开源在推进技术平权，让更多人享受技术的同时，也会让大家“拿来主义”，不会再考虑底层的创新了。TrainiCEO孙邻家认为，“技术过度平权不一定是好事，会失去创新的驱动力。”

闭源因为技术垄断，商业化上能赚取更大利润，在技术底层创新能投入更大资源。而且闭源更能成为一个稳定、安全、专注的产品。

我们想想当年的以苹果为代表的IOS系统，和谷歌为代表的安卓系统，就深有体会。大众消费者直观体会，就是苹果系统不卡，安卓卡的要死。当年小米MIUI大受欢迎，就是在安卓开源底层做的优化，让广大手机用户体验大幅提升。不是美国的封锁，华为也没有动力大力投入鸿蒙系统的研发上，经济账算不过来。只是被逼的没办法了，才逼出了鸿蒙系统。

开源和闭源是一个硬币的两面。

开源、闭源其实都存在透明性、合规性、安全性的问题，也涉及治理问题。开源可能促进我们更多的探索性和基础性工作；闭源更多促进产品化和商业化，推动技术走进每个人的生活。这两件事其实不应该是之争，而是和谐共存。

02开源大模型与开源软件有三大区别

大模型开源和传统软件开源不是一回事。

软件开源是指源代码开源，拿到源代码，我们就知其然也知其所以然，也可以在源代码基础上，去修改或增加新功能。

但大模型是一个黑盒子，里面有很多至今无法解释的现象，所以对大模型的开源，业界提出了更多维度，有的说需要四部分——权重、数据集、代码和训练过程；也有的说需要五部分，还包括了框架。即使是这些定义，业界也有不同意见：为什么会有这样的定义？这更像是从传统开源软件的思路来考虑的。

有趣的是，只有极少数公司或机构的大模型，同时开源了上述四部分或五部分，比如IBM刚刚开源出来的Granite大语言模型；也有像智源研究院、马斯克旗下大模型公司xAI ，开源了权重和数据集。比如，根据智源人工智能研究院副院长兼总工程师林咏华的介绍，智源最新开源数据集分为两类，一类是通用开源指令微调数据集，一类是行业垂类数据集，涵盖18个行业。

“现在业界的共识是，至少将权重再加上一些推理代码开源。”零一万物林旅强说，只有这两部分开源，其他人才可以将开源大模型使用起来。由此，开源大模型现在的定义，有点像微软提过的“免费软件”。所以，谷歌等公司在其官网上称是开源权重（open weight），而不是开源大模型。

为什么在开源大模型中，权重如此重要？有业界人士将权重打比方为“一大堆数字”，一个13B的模型，就有130亿个数。这些数字与模型如何处理输入的数据、如何做出预测和生成文本等相关，代表了一个大模型的智慧。

而在大模型中，代码分为预训练代码、微调代码和推理代码。预训练代码是大模型公司的核心；对于微调代码，市场上已有很多公开方法，而大模型要被用起来，需要推理代码。至于训练过程和数据集，往往也是大模型厂商的核心所在。

与传统软件不同，在大模型开源上，企业的态度有了微妙的变化。现在大模型的成本太过高昂，训练一个千亿级参数模型，要几千万甚至上亿，因此，很多公司在开源问题上变得保守。这是一个现实问题，每家公司的开源，必然服务于自己的商业战略。而且，即便将这些核心都开源出来，大多数工程师和企业也没有那么多资源去复现。

业内人士认为，开源大模型和开源软件有三个核心区别：

一是透明度完全不一样。开源软件的代码能说明一切，从而可以形成一套治理体系；大模型当下还是一个黑盒子，内部机理还是未知的。

二是大模型社区的性质发生了变化。之前开源社区讲求全球工程师来贡献；但因为算力等资源限制，在大模型社区里，或许90%以上的工程师，无法直接为大模型贡献，因此很多社区变成了单向模式，大家只是使用大模型。在HuggingFace上，Meta的Llmma开源大模型，已经有几千个变种，但彼此之间没有太多交互，也很难将创新合并。

其三是大模型企业开源策略发生变化。中国信通院知识产权与创新发展中心产业发展研究部主任张俊霞说，因为大模型的训练投入特别大，这导致企业在开源策略的选择上，特别是在一些许可或信息披露上，都有很大不同。“这个问题现在不管是国内还是国际社区，都在非常激烈地讨论。”

开源的目的不是一定要超越闭源。

单纯把开源模型和闭源模型放在一起来比较，可能有失公允。因为闭源大模型可能是一套体系，比如包含了检索增强等技术，而开源模型是一个单体模型，拿“多对一”，肯定不合理。

开源的价值是更加公开透明，技术上更加平权，不会让其成为少数人牟利的手段。“更为关键的是，对于人工智能来说，如果未来走向AGI，开源让AI的发展走向，更符合全人类的利益，这一点的价值要远高于在某一方面去超越闭源。”

而开源和闭源大模型谁更安全，业界也有着争议。开源派认为，在闭源环境当中，大家不知道有没有人监督它。开源的好处是一旦出现一些安全问题，整个社区会来共同检查。

但也有人士认为“开源也会带来各种意想不到的问题”。比如，开源可能将大模型交到了“恐怖分子”手里。“举个例子，开源大模型的数据集，如果别人加了一些数据，训练出大模型去干了违法的事。”一家大模型企业开源负责人说。另外，现在各国都强调数据主权，数据开源后怎么追踪也是问题。所以国家鼓励开源，但不是无限制的开源。

开闭源，商业化如何选择？

在开闭源的选择上，智谱张鹏认为，如果只是想做一些实验和尝试，可以选择开源模型，但如果想要在上面做商业化应用，大部分人还是会选择商业化版本，因为有保障，能够提供更好的服务。

这代表了业界、尤其是ToB行业很多人士的观点。

无论是开源、闭源，需要优先考虑客户是否需要本地部署大模型。无论国内外，不少客户都有自主可控的需求。如果采用公有云上的模型，比如OpenAI，客户要考虑数据暴露信息的问题。

值得注意的是，闭源大模型是否能部署到本地，需要获得允许。开源大模型同样需要依据一些协议以及合规性。从技术角度来讲，很多开源部署到本地是可行的。而开源可以方便地进行微调，打造行业大模型，这是其优势。

大模型的需求一定是开放混合的。具体要结合行业和场景，比如政务领域，客户对数据安全要求极高，不能触碰红线，需要私有化部署，开源模型在这方面更为灵活方便。

结语

DeepSeek的开源促使百度宣布开源策略不仅仅是鲶鱼效应，而是彻底地改变了大模型行业的玩法。

就像刚刚过去的阿联酋迪拜World Governments Summit 2025峰会上，百度创始人李彦宏所说：“我认为，创新是不能被计划的。你不知道创新何时何地到来，你所能做的是，营造一个有利于创新的环境。”