当DeepSeek惊艳世界,才惊觉中国AI已全面“燎原”
春节前后,DeepSeek冲击了全球各大媒体的头版头条。其高水准的表现和低廉的成本,让不少媒体和从业者“怀疑人生”,人们不禁开始反思以Open AI为代表的“大力出奇迹”思路是否真的是AI发展的最优路径。
窥一斑而知全豹,一些反应迅速又思虑深远的外媒,也已经注意到了DeepSeek背后中国AI全面崛起的图景。华尔街日报日前发布报道《It’s Not Just DeepSeek. A Guide to the Chinese AI Companies You Need to Know》,提醒美国人要注意哪些中国大模型公司。
文中主要将这些公司划分为科技大厂和创业企业两种类型,创业企业中DeepSeek和Stepfun等受到极大关注,科技大厂之中,阿里、百度则成为重点研究对象。华尔街日报着重指出,百度在中国最早推出面向公众的生成式AI文心一言,如今这款产品已经拥有4.3亿用户。
01全面崛起,百家争鸣的中国大模型
中国AI并非是突然之间来到与美国并驾齐驱的高度的,DeepSeek的爆红,更像是量变引起的一次质变,是整个中国AI产业的持续闪耀的过程中一次璀璨的迸发,这背后是无数厂商长期投入的结果。在Open AI聚集了全球目光的这几年里,中国的大模型悄悄进入了一个百家争鸣的阶段。
深度求索成立于2023年,今年春节期间发布R1,让DeepSeek迎来了第一个高光时刻。人们惊奇地发现,这家名不见经传的东方小企业,做出了媲美Open AI最前端模型的产品,要知道,其对标的o1模型,即便是每月支付20美元的付费用户,也只能限量使用,而DeepSeek则是完全免费的。
大厂方面,得益于充沛的技术基础和资源调动能力,他们可以构建更加完备的基础设施,或者将应用融入到既有的产品矩阵当中。比如快手团队研发的可灵AI,在文生图、图生视频的领域极具特色,特别支持对已生成的视频进行一键续写,这给用户展现创意提供了张力。再比如豆包大模型,由同样做短视频起家的字节跳动研发,支持多模态信息交互,对提升社交体验的各类功能提供了良好的支持。场景应用从移动时代开始就是中国科技企业的一大优势,这在快手、字节的大模型研发上再一次得到印证。
更具有深刻代表性的是领航中国AI的百度。一方面,百度做了大量的底层技术创新,从算法、算力等多个层面上持续推动AI产业的成长,其“大模型技术”连续两年获得世界互联网大会的领先科技奖,在中文处理方面实现了领先;另一方面,百度将这种能力开放给全社会,以AI开发者平台为核心,让AI能力向各个领域辐射和延伸。当然,还有一方面是百度自身研发的大模型得到越来越广泛的应用。2023年初,文心一言紧随Chat GPT上线,依托百度在搜索、云计算等领域的先天优势,文心一言不断更新优化,成为目前国内在技术积累、应用落地和开放性平台方面都处于绝对优势的大模型。
中国的AI产业从扎堆大模型到精耕应用场景再到多点开花的技术创新,在过去的数年里走出了一条与美国AI产业不尽相同的道路。直到DeepSeek的爆红,这条道路终于被世人看到。从产品表现来看,中美两国的AI能力比预想得要更接近一些。
02外媒恐慌的源头
意料之外的创新能力DeepSeek此番在美国掀起的波澜,堪称空前。先有英伟达应声跌去17%,后有美国国会要求白宫予以“特别关照”,再后来又衍生出大量的抹黑言论意图为DeepSeek泼上脏水,甚至专业黑客也出马攻击DeepSeek的服务器。然而谁也逃不掉“口嫌体正直”的魔咒,就在昨天,微软、亚马逊、英伟达不约而同地选择接入DeepSeek-R1模型。
日前,美联社也发布报道《DeepSeek has rattled the AI industry. Here’s a quick look at other Chinese AI models》,文章称即使在芯片的限制下,中国可能也已在AI竞赛中超越美国,而DeepSeek还只是众多中国公司之一,整个AI行业已经被中国“打乱节奏”。文章着重点名百度、字节跳动以及阿里巴巴,表达了西方对这些公司AI能力的忧虑。
美国对以DeepSeek为代表的中国AI产业之所以如此惊恐,主要有两大原因,一是对信息安全是否受到威胁的顾忌,二是对优势地位是否能延续的焦虑。在美国官方看来,技术先进,开源,低成本,哪一个都不可怕,但叠加在一起就堪称“王炸”,如果美国企业和民众纷纷选择使用来自于中国的便宜好用的开源大模型,那将是对信息安全的一种重大冲击;另一方面,低成本投入完成高水平产品,意味着中国企业的创新能力击败了,或者至少说,完全不逊色于巨额资金喂养出的美式企业,这意味远期来看美国将不再对技术优势地位有十足的把握。
换句话说,中国AI企业表现出了强大的创新能力,这种另辟蹊径、后发先至所带来的惊人成果,最容易让领先者坐立不安。
DeepSeek以600万美元对标美企数十亿投资的故事大家已经耳熟能详,我们以大厂再另举一例。百度基于检索的优势创新性地推出了检索增强生成技术,即RAG。通过结合信息检索与文本生成模型,RAG大幅提高了生成内容的相关性和准确性,有效解决了传统生成式模型经常“胡言乱语”的问题。对个人用户来说,这极大程度地优化了问答体验,避免了错误结论;而对于企业用户来说,这一能力也让智能客服、知识图谱等服务的质量得以明显提升。
借助春节期间的热点,笔者对拥有RAG能力的文心一言,和Chat GPT的4o模型进行了多轮对比测试,力求全方位、深层次地剖析两者的性能差异,探究它们在不同场景下的表现。测试中,文心一言对最新的春节档电影细节、春晚节目等内容能准确回答,对某一节目独特的创意构思、演员们的精彩幕后故事等,它也能对答如流,满足用户对最新资讯的了解需求。
反观Chat GPT-4o,虽然它以全能性和多模态交互为主要特点,支持文本、音频和图像的输入输出,能实现跨模态的理解和生成,且具有快速响应时间和多语言处理能力,但在此次测试中,却暴露出了一些短板。在面对需要兼顾信息检索与信息生成的问题时,Chat GPT-4o往往显得力不从心,难以准确地回答问题。下图是两者面对同一问题的直观对比(上方为文心一言,下方为ChatGPT),结果差异十分明显。
即便是“口碑”这种相对软性的问题,文心也给出了符合事实情况的回答;ChatGPT则给出了完全错误的结论。
文心准确回答正在发生中的事实情况;ChatGPT则一本正经地转移了话题。
对于更早期的历史,文心一言给出了简洁规范的准确答案;ChatGPT的回答不但结构松散,最关键的是信息出现巨大错误,奖牌榜第四名是俄罗斯,第五名是韩国。
此次对近期事件-与美国相关事件-远期事件对比测试的结果表明,文心一言在信息检索与生成的综合能力上,尤其是在处理具有时效性和本土特色的话题时,展现出了超越Chat GPT-4o的优势。这一发现不仅为广大用户在选择使用人工智能模型时提供了重要的参考依据,也为人工智能领域的发展提供了新的思考方向,促使行业内不断探索和创新,推动人工智能技术迈向更高的台阶。
03中美并跑时代或能为AI创造更大红利
从美国一家独大,到中美并跑,这是一件值得恐慌的事情吗?显然不是,正相反,这种变化反而有可能会给AI产业带来焕然一新的局面。众所周知,良性的竞争、适当的压力,更有利于产业的发展和进步。尽管一部分美国的媒体和AI从业者表现出了警惕和恐慌,但其实长远来说,中国AI的崛起对整个AI产业是极大的利好。
日前,Meta创始人扎克伯格就称赞DeepSeek在基础设施优化上"新颖的进展",并认为Meta可以从DeepSeek的成就中受益,更早一些苹果公司CEO库克也认为DeepSeek推动了效率的创新,而这显然是一件好事。
无论是DeepSeek在成本控制和代码开源上带来的冲击,抑或是百度在专长领域带来的底层技术创新,这些革新都不仅仅是让企业自身受益,而是更整个行业带来了更多发展契机。比如说,以前人们都无条件认可Open AI巨量算力、数据投入的发展模式,而自这个春节以后,人们就会思量一下,是否还有更优的选择,这一方面开拓了思路,另一方面也减少了资源浪费。而百度在RAG、中文自然语言处理等领域的积累,显然也可以对美国主流大模型优化生成结果提供重要的参考和借鉴。
Open AI计划在2025年推出03模型,百度也将在这一年发布文心5.0,更多中美两国的AI企业都在酝酿重大动作。2025年,中美你追我赶或许将成为AI领域的主旋律,这与以往的一枝独秀格局不同,多元化的成长路径,不同思路的碰撞与磨合,都必将会给整个产业带来更多可能性。
原文标题 : 当DeepSeek惊艳世界,才惊觉中国AI已全面“燎原”
最新活动更多
-
2月28日火热报名中>> 【免费试用】东集技术年终福利——免费试用活动
-
即日-3.21立即报名 >> 【深圳 IEAE】2025 消费新场景创新与实践论坛
-
4日10日立即报名>> OFweek 2025(第十四届)中国机器人产业大会
-
7.30-8.1火热报名中>> 全数会2025(第六届)机器人及智能工厂展
-
即日-2025.8.1立即下载>> 《2024智能制造产业高端化、智能化、绿色化发展蓝皮书》
-
精彩回顾立即查看>> 【限时免费】安森美:Treo 平台带来出色的精密模拟
推荐专题
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论