3分钟看懂大模型开闭源战争,谁将主宰未来?
2月14日,百度宣布开源!百度称将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。
自DeepSeek开源之风席卷全球后,开源闭源路径选择一直是AI领域热议焦点。连此前坚持闭源的百度都转投开源阵营,足见开源之势已占据上风。今天我们就来聊聊开源和闭源的优劣势,到底大模型开源和软件开源有什么区别?开闭源的商业化应用到底如何选择?文末可免费获取30份大模型行业研究报告
01开源和闭源的优劣势
“开源”一词源自软件领域,指在软件开发过程中公开其源代码,允许任何人查看、修改和分发。开源软件的开发通常遵循互惠合作和同侪生产的原则,促进了生产模块、通信管道和交互社区的改进,典型代表包括Linux,Mozilla Firefox,安卓。
闭源软件(专有软件)由于商业模式等其他原因,不公开源代码,只提供计算机可读的程序(如二进制格式)。源代码仅由开发者掌握和控制。典型代表包括Windows,IOS。
开源是一种软件开发模式,基于开放、共享和协作,鼓励大家共同参与软件的开发和改进,推动技术的不断进步和广泛应用。也是开源派倡导的技术平权,不应该让少数人垄断技术。
选择闭源开发的软件更有可能成为一个稳定、专注的产品,但是闭源软件通常需要花钱,且如果它有任何错误或缺少功能,只能等待开发商来解决问题。
开源与闭源既是技术策略,更是商业策略。表面上是发展路线之争,实则是利益之争。
开源与闭源确实各有利弊。
开源在推进技术平权,让更多人享受技术的同时,也会让大家“拿来主义”,不会再考虑底层的创新了。TrainiCEO孙邻家认为,“技术过度平权不一定是好事,会失去创新的驱动力。”
闭源因为技术垄断,商业化上能赚取更大利润,在技术底层创新能投入更大资源。而且闭源更能成为一个稳定、安全、专注的产品。
我们想想当年的以苹果为代表的IOS系统,和谷歌为代表的安卓系统,就深有体会。大众消费者直观体会,就是苹果系统不卡,安卓卡的要死。当年小米MIUI大受欢迎,就是在安卓开源底层做的优化,让广大手机用户体验大幅提升。不是美国的封锁,华为也没有动力大力投入鸿蒙系统的研发上,经济账算不过来。只是被逼的没办法了,才逼出了鸿蒙系统。
开源和闭源是一个硬币的两面。
开源、闭源其实都存在透明性、合规性、安全性的问题,也涉及治理问题。开源可能促进我们更多的探索性和基础性工作;闭源更多促进产品化和商业化,推动技术走进每个人的生活。这两件事其实不应该是之争,而是和谐共存。
02开源大模型与开源软件有三大区别
大模型开源和传统软件开源不是一回事。
软件开源是指源代码开源,拿到源代码,我们就知其然也知其所以然,也可以在源代码基础上,去修改或增加新功能。
但大模型是一个黑盒子,里面有很多至今无法解释的现象,所以对大模型的开源,业界提出了更多维度,有的说需要四部分——权重、数据集、代码和训练过程;也有的说需要五部分,还包括了框架。即使是这些定义,业界也有不同意见:为什么会有这样的定义?这更像是从传统开源软件的思路来考虑的。
有趣的是,只有极少数公司或机构的大模型,同时开源了上述四部分或五部分,比如IBM刚刚开源出来的Granite大语言模型;也有像智源研究院、马斯克旗下大模型公司xAI ,开源了权重和数据集。比如,根据智源人工智能研究院副院长兼总工程师林咏华的介绍,智源最新开源数据集分为两类,一类是通用开源指令微调数据集,一类是行业垂类数据集,涵盖18个行业。
“现在业界的共识是,至少将权重再加上一些推理代码开源。”零一万物林旅强说,只有这两部分开源,其他人才可以将开源大模型使用起来。由此,开源大模型现在的定义,有点像微软提过的“免费软件”。所以,谷歌等公司在其官网上称是开源权重(open weight),而不是开源大模型。
为什么在开源大模型中,权重如此重要?有业界人士将权重打比方为“一大堆数字”,一个13B的模型,就有130亿个数。这些数字与模型如何处理输入的数据、如何做出预测和生成文本等相关,代表了一个大模型的智慧。
而在大模型中,代码分为预训练代码、微调代码和推理代码。预训练代码是大模型公司的核心;对于微调代码,市场上已有很多公开方法,而大模型要被用起来,需要推理代码。至于训练过程和数据集,往往也是大模型厂商的核心所在。
与传统软件不同,在大模型开源上,企业的态度有了微妙的变化。现在大模型的成本太过高昂,训练一个千亿级参数模型,要几千万甚至上亿,因此,很多公司在开源问题上变得保守。这是一个现实问题,每家公司的开源,必然服务于自己的商业战略。而且,即便将这些核心都开源出来,大多数工程师和企业也没有那么多资源去复现。
业内人士认为,开源大模型和开源软件有三个核心区别:
一是透明度完全不一样。开源软件的代码能说明一切,从而可以形成一套治理体系;大模型当下还是一个黑盒子,内部机理还是未知的。
二是大模型社区的性质发生了变化。之前开源社区讲求全球工程师来贡献;但因为算力等资源限制,在大模型社区里,或许90%以上的工程师,无法直接为大模型贡献,因此很多社区变成了单向模式,大家只是使用大模型。在HuggingFace上,Meta的Llmma开源大模型,已经有几千个变种,但彼此之间没有太多交互,也很难将创新合并。
其三是大模型企业开源策略发生变化。中国信通院知识产权与创新发展中心产业发展研究部主任张俊霞说,因为大模型的训练投入特别大,这导致企业在开源策略的选择上,特别是在一些许可或信息披露上,都有很大不同。“这个问题现在不管是国内还是国际社区,都在非常激烈地讨论。”
开源的目的不是一定要超越闭源。
单纯把开源模型和闭源模型放在一起来比较,可能有失公允。因为闭源大模型可能是一套体系,比如包含了检索增强等技术,而开源模型是一个单体模型,拿“多对一”,肯定不合理。
开源的价值是更加公开透明,技术上更加平权,不会让其成为少数人牟利的手段。“更为关键的是,对于人工智能来说,如果未来走向AGI,开源让AI的发展走向,更符合全人类的利益,这一点的价值要远高于在某一方面去超越闭源。”
而开源和闭源大模型谁更安全,业界也有着争议。开源派认为,在闭源环境当中,大家不知道有没有人监督它。开源的好处是一旦出现一些安全问题,整个社区会来共同检查。
但也有人士认为“开源也会带来各种意想不到的问题”。比如,开源可能将大模型交到了“恐怖分子”手里。“举个例子,开源大模型的数据集,如果别人加了一些数据,训练出大模型去干了违法的事。”一家大模型企业开源负责人说。另外,现在各国都强调数据主权,数据开源后怎么追踪也是问题。所以国家鼓励开源,但不是无限制的开源。
03
开闭源,商业化如何选择?
在开闭源的选择上,智谱张鹏认为,如果只是想做一些实验和尝试,可以选择开源模型,但如果想要在上面做商业化应用,大部分人还是会选择商业化版本,因为有保障,能够提供更好的服务。
这代表了业界、尤其是ToB行业很多人士的观点。
无论是开源、闭源,需要优先考虑客户是否需要本地部署大模型。无论国内外,不少客户都有自主可控的需求。如果采用公有云上的模型,比如OpenAI,客户要考虑数据暴露信息的问题。
值得注意的是,闭源大模型是否能部署到本地,需要获得允许。开源大模型同样需要依据一些协议以及合规性。从技术角度来讲,很多开源部署到本地是可行的。而开源可以方便地进行微调,打造行业大模型,这是其优势。
大模型的需求一定是开放混合的。具体要结合行业和场景,比如政务领域,客户对数据安全要求极高,不能触碰红线,需要私有化部署,开源模型在这方面更为灵活方便。
结语
DeepSeek的开源促使百度宣布开源策略不仅仅是鲶鱼效应,而是彻底地改变了大模型行业的玩法。
就像刚刚过去的阿联酋迪拜World Governments Summit 2025峰会上,百度创始人李彦宏所说:“我认为,创新是不能被计划的。你不知道创新何时何地到来,你所能做的是,营造一个有利于创新的环境。”
无论是开源还是闭源,无论是大厂还是创业者,面对技术更迭最好的办法就是用魔法打败魔法。
原文标题 : 3分钟看懂大模型开闭源战争,谁将主宰未来?

最新活动更多
-
2月25日火热报名中>> Ansys Motion薄膜卷曲卷对卷工艺仿真解决方案
-
2月28日火热报名中>> 【免费试用】东集技术年终福利——免费试用活动
-
即日-3.21立即报名 >> 【深圳 IEAE】2025 消费新场景创新与实践论坛
-
3月27日立即报名>> 【工程师系列】汽车电子技术在线大会
-
4日10日立即报名>> OFweek 2025(第十四届)中国机器人产业大会
-
7.30-8.1火热报名中>> 全数会2025(第六届)机器人及智能工厂展
推荐专题
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论