国内大模型的泡沫有多大？DeepSeek给AI巨头上了一课!

2025-02-26 14:07

在科技飞速发展的今天，大模型领域宛如一片充满无限可能的新大陆，吸引着无数企业与资本竞相探索。而DeepSeek的横空出世，恰似一颗重磅炸弹，在这片领域掀起了惊涛骇浪，让国内众多AI大模型的真实状况，暴露无遗。

观察，DeepSeek的出现，不仅打破了原有的市场格局，更引发了资本、技术与商业层面的一系列连锁反应，深刻地影响着国内AI大模型行业的走向。

DeepSeek异军突起，揭了本土AI大模型的“老底”

据媒体报道，自DeepSeek发布以来，其在用户增长方面展现出了惊人的速度。上线仅20天，其日活跃用户数就突破了2000万大关，达到2215万，这一数字不仅成功超越了豆包的1695万日活跃用户数，更是达到了ChatGPT日活跃用户的41.6%。而在上线的第21天，其月活跃用户数（MAU）更是飙升至3370万，如此迅猛的增长态势，在大模型领域实属罕见。

反观国内其他大模型，许多产品在用户增长上陷入了瓶颈。以曾经在C端市场风光无限的Kimi为例，去年凭借一系列营销手段，Kimi在B站等平台大规模投流，成功吸引了大量用户，一度成为国产大模型的“流量担当”。

然而，DeepSeek的出现，瞬间打破了一些AI软件的增长神话。在DeepSeek爆火之后，部分AI软件的用户增长几乎停滞，新用户获取变得困难，老用户活跃度也持续下降。曾经热闹的AI社区，如今讨论热度也大幅降低，用户纷纷转向体验更好的DeepSeek。

从应用下载量来看，DeepSeek在各大应用商店的排名一路飙升。上线一个月内，下载量突破5000万次，在同类应用中名列前茅。而同期国内某知名大模型应用，尽管此前也积累了一定的用户基础，但在DeepSeek的冲击下，下载量增长不足10%，在应用商店的排名也逐渐被其他新兴应用超越。

不难发现，这种巨大的差距，直观地反映出DeepSeek在市场吸引力上的巨大优势，也凸显出国内其他大模型在用户获取和留存方面的严重不足。

实际上，在Deepseek出现前，国内的AI大模型应用就存在一些不足，只是，随着Deepseek逐渐得到行业认可，在其对比之下，其原有的不足也如同被“揭老底”，暴露无疑。

具体来看，AI大模型的行业应用深度渗透与差距依然不可忽视。据观察，相对很多AI大模型产品只是停留在智能文案创作、智能客服服务等方向，DeepSeek在行业应用方面，已经成功渗透到金融、医疗、教育等多个关键领域，并与众多头部企业建立了深度合作关系。

例如，在金融风控领域，DeepSeek的智能模型能够快速、准确地识别各种潜在风险，为金融机构提供高效、可靠的风险预警服务。

据媒体报道，某大型银行在引入DeepSeek的风控模型后，风险识别准确率提高了30%，不良贷款率显著降低，有效提升了银行的风险管理水平和运营效率。

而在医疗领域，DeepSeek的大模型可以辅助医生进行疾病诊断和治疗方案制定。通过对大量医疗数据的学习和分析，它能够快速给出合理的诊断建议和治疗方案参考，为医生节省了大量时间和精力。据了解，在一些医学影像诊断任务中，DeepSeek的模型表现甚至超过了部分经验不足的医生，大大提高了诊断的准确性和效率。

与之形成鲜明对比的是，国内部分大模型在行业应用中却面临着诸多挑战。由于技术不够成熟，在面对复杂的业务场景时，常常出现误判、漏判等问题。实际上，这不仅在国内，在海外大模型产品，也曾出现了因为算法不够智能出现误判给人们生活带来极大风险的案例。

此前有一篇国外论文显示，在北美一款流行的蘑菇识别AI工具在识别毒蘑菇时常出现误判，将致命的毒蘑菇如毒蝇伞、死亡帽误判为可食用品种，导致数十人因食用有毒真菌入院治疗。

而即使是最初带火国内AI大模型热潮的ChatGPT，也曾陷入媒体的质疑之声中。例如，纽约科恩儿童医疗中心的研究显示，ChatGPT-3.5在分析儿科病例时，其错误诊断率高达83%。夸张的错误率引发了对其可靠性的重大质疑。

此外，一项研究将100份来自《美国医学会杂志·儿科学》和《新英格兰医学杂志》的儿科病例输给ChatGPT，并发现聊天机器人尽管输出了一些具有一定相关性的答案，但绝大多数都不够具体。

实际上，在金融、医疗场景，同样存在国内大模型因为技术不成熟、应用场景不匹配等客观问题的存在，而限制了其在行业内的应用推广，与DeepSeek广泛应用并深受欢迎相比，更是相形见绌。

资本风向的急剧转变，本土模型再难获得资本加持

在关于AI大模型的嘈杂声音中，还有一种观点认为，目前DeepSeek再次掀起的大模型热潮，并没有改变资本已经逐渐变得理性、冷静的客观事实。

例如，1月初，一则有关“01万物散伙了卡和预训练团队卖给阿里了”的传闻开始出现在社交媒体。虽然事后零一万物创始人兼CEO李开复，对此进行了辟谣。

但是据《智能涌现》等媒体报道：零一万物与部分地方政府和国资的融资进展并不顺利，“账上的钱撑不到一年”。这也意味着，进入2025年，AI大模型独角兽的淘汰赛开启了。这也是延续2024年AI大模型如何生存老话题的又一挑战。

不过，DeepSeek的出色表现，却让资本对其态度截然不同。近期，有分析人士预测，DeepSeek目前的估值已经达到1500亿美元，梁文锋的个人财富可能达到1260亿美元，甚至高于目前英伟达创始人CEO黄仁勋的个人财富。

据了解，DeepSeek投资方阵容堪称豪华，汇聚了国内外顶尖投资机构。这些资本的注入，为DeepSeek的技术研发、人才招募和市场拓展提供了充足的资金支持，使其在市场竞争中拥有更强大的资源优势。

例如，某国际知名投资机构在对DeepSeek进行深入调研后，毫不犹豫地投入了数亿美元，成为其重要股东之一。该投资机构表示，DeepSeek在技术创新和商业应用方面展现出的巨大潜力，使其成为了大模型领域最具投资价值的项目之一。

本土模型的融资困境与挑战

与DeepSeek的风光无限形成鲜明对比的是，国内其他大模型企业在资本层面遭遇了前所未有的寒冬。许多原本计划投资大模型领域的资本，纷纷将目光转向了DeepSeek，导致国内其他大模型企业的融资难度大幅增加。

据不完全统计，2024年下半年至2025年初，国内大模型领域的融资总额下滑，而流向DeepSeek的资金，却占据了新增融资的半壁江山。据了解，一些中小规模的大模型初创公司，由于缺乏资本支持，在技术研发和人才吸引方面面临重重困难。

而由于无法承担高昂的研发成本，这些公司的技术更新迭代缓慢，产品竞争力逐渐下降；在人才市场上，由于资金有限，难以提供具有竞争力的薪酬和福利待遇，导致优秀人才纷纷流向资金充裕的DeepSeek等企业。

前文所述，曾经以零一万物为代表、备受关注的“AI六小虎”，如今也因DeepSeek的出现，在融资和估值方面受到了严重影响。

除了部分企业融资计划被迫搁置，企业估值大幅下调的压力外，人才流失的问题也格外严重。据媒体报道，2024年下半年以来，大模型独角兽的不少核心成员都选择了出走创业。

例如，12月初，有报道显示，百川智能联合创始人、商业化负责人洪涛离职。而在此之前，零一万物算法副总裁、模型预训练负责人黄文灏，于今年8月加入了字节跳动。另外，有媒体报道称月之暗面几位出海产品负责人也于11月前后离职创业；MIniMax产品负责人张前川于今年9月被确认离职后，至今未更新消息。

资本的冷遇、人才的流失，使得国内大模型企业在发展过程中面临着巨大的资金压力，许多企业不得不削减研发投入和市场推广费用，以维持企业的正常运营。这进一步削弱了它们在市场上的竞争力，形成了一个恶性循环，让国内大模型企业在与DeepSeek的竞争中。愈发艰难。

2B、2C商业落地的“左右为难”

据了解，目前国内AI大模型普遍面临商业化挑战。而且，在技术路线以及在商业模式方面，2B还是2C是一道选择题。

例如，开年伊始，AI六小虎之一的零一万物，率先作出了妥协，调整团队、放弃超大模型、主攻应用。虽然零一万物创始人李开复坦言，零一万物开启了“大厂+小虎”的全新模式，但从某种程度来说，零一万物已然与其他“小虎”在规模和影响力上有了差异。

李开复的那句“这就是一个难解的局，To B、TOC、国内、国外，都不容易做”，似乎确是当下国产AI初创时，在商业模式方面进退两难的真实写照。

也有一种基金的观点认为，国内大模型创业公司纷纷押注To B，不是因为To B赛道有多好，而是因为只能承担To B商业模式。现在除了互联网巨头，没人敢对AI to C模式烧钱。例如百川押注医疗解决方案，因为连王小川都不敢在To C产品上堆人力，砸钱获客更是十分谨慎。

尽管如此，依然有AI大模型企业在C端产品方面拿到了结果。例如，据量子位2024年5月13日报道，零一万物海外To C产品上线9个月用户近千万，2014年单款产品预计收入过亿元，产品ROI（投入产出比）接近1。

除此以外，2024年实现跨越式发展的Kimi母公司月之暗面，也被视为2C模式下的一匹黑马。在当年获得了多轮巨额资本的加持。

例如，据天眼查显示，2024年2月，月之暗面完成超10亿美元融资，投资方包括阿里巴巴、红杉中国、美团、小红书等知名机构和企业，此后的2024年8月，月之暗面再次公布B轮融资，融资额超3亿美元。

多轮资本的接力，也让其估值持续飙升，由25亿飙升至33亿美元，成功晋级行业头部阵营，值得注意的是，在不久前，月之暗面宣布会将重心聚焦于Kimi，而2024年3月，KimiChat将上下文输入限制突破至200万文字，此消息一出，小程序一度宕机，甚至二级市场催生了Kimi概念股板块。

只是，在DeepSeek强势来袭后，Kimi也显得有些黯然失色。而字节跳动旗下的豆包等2C免费的产品，更是因为2C的商业模式并不清晰，而缺少想象力。

对比之下，在商业落地方面，DeepSeek已经与多个行业的头部企业达成合作，实现了从技术到产品的快速转化，商业价值得到了充分验证。通过与企业的合作，DeepSeek能够深入了解行业需求，针对性地优化模型和产品，为企业提供定制化的解决方案，从而实现商业价值的最大化。

因此，总结DeepSeek的声名鹊起，或许得益于其在C端积累了用户口碑，在B端拿下了诸多订单，因此也得以在资本市场所向披靡，受到资本与市场、消费者的热捧也是时代的必然。

只是，对比之下，国内其他大模型厂商过去的各种高调、夸张式的宣传，DeepSeek无异于扯掉了这些AI企业的遮羞布，甚至让很多AI大模型的从业者有些无地自容。

尤其是坊间传言的DeepSeek揭穿了英伟达黄仁勋“推理过程需要大量英伟达GPU和高性能网络”的谎言，更是颇有一种讽刺意味。

期待DeepSeek能够真正为百模大战开辟出一条新道路，让曾经有些“虚胖”、被过度鼓吹的AI大模型行业，变得更加接地气，从而真正释放AI技术的应用价值。

作者：尼古

编辑：尼克免责声明:本文基于已公开的资料信息或受访人提供的信息撰写，但财狗商业评论及文章作者不保证该文章提及或者展示关联等信息资料的完整性、准确性。在任何情况下，本文中的信息或所表述的意见均不构成对任何人的投资建议。

原文标题 : 国内大模型的泡沫有多大？DeepSeek给AI巨头上了一课!

本地收藏打印推荐给朋友

声明： 本文由入驻维科号的作者撰写，观点仅代表作者本人，不代表OFweek立场。如有侵权或其他问题，请联系举报。

发表评论

共0条评论，0人参与

登录登录即可访问所有OFweek服务

用户名/邮箱/手机：
密码：
忘记密码？
用其他账号登录： QQ | 微信 | 新浪微博

请输入评论内容...

请输入评论/评论长度6~500个字

暂无评论

图片新闻