订阅
纠错
加入自媒体

DeepSeek的压力给到华尔街,掀起蝴蝶效应

2025-02-07 11:22
Ai芯天下
关注

前言:

传统AI训练对算力的需求巨大,而英伟达的芯片作为算力的核心,其重要性不言而喻。

然而,DeepSeek的问世使市场认识到,AI对算力的需求并非如先前所预期的那样庞大。

作者 | 方文三

图片来源 |  网 络 

图片

DeepSeek打开大模型新思路

2024年1月20日,DeepSeek公司正式发布了其推理模型DeepSeek-R1的完整版本。

该模型以较低的训练成本实现了与OpenAI推理模型o1相媲美的性能,并且完全免费开源,这一举措在业界引起了巨大反响。

众多开发者表示,他们正在考虑利用DeepSeek技术对现有系统进行彻底的重构。

在这一趋势的推动下,DeepSeek推出的移动端应用在一周内迅速发酵,并在发布仅一个月后,跃升至美区苹果应用商店免费应用排行榜首位,不仅超越了ChatGPT,也超越了其他热门应用。

2025年1月28日,DeepSeek进一步开源了其多模态模型Janus-Pro-7B,并宣称在GenEval和DPG-Bench基准测试中胜过了DALL-E 3(由OpenAI开发)和Stable Diffusion。

在本次DeepSeek Janus Pro与DALL-E 3的对比分析中,DALL-E 3的参数量先前公布为120亿,而Janus Pro的大模型参数量仅为70亿。

R1的问世不仅打破了科技巨头独占推动旗舰开源模型的传统行业共识,还颠覆了去年形成的另一个行业共识,即通用大型模型正逐渐演变成大型企业间资本竞争的领域。

图片

硬件媒体Tom's Hardware发布了开年最受关注的报道:DeepSeek甚至绕过了CUDA,转而使用更为基础的编程语言进行优化。

DeepSeek R1与OpenAI o1在技术上的关键区别在于其创新的训练方法,例如在数据训练阶段采用的R1-Zero方法,直接将强化学习(RL)应用于基础模型,而无需依赖监督微调(SFT)和已标注数据。

根据DeepSeek官方技术文档,R1模型利用数据蒸馏技术(Distillation)生成的高质量数据,提升了训练效率。

数据蒸馏是指通过一系列算法和策略,对原始、复杂的数据进行去噪、降维、提炼等处理,从而得到更为精炼、有用的数据。

这也是DeepSeek能够以更少的参数量实现与OpenAI o1模型性能相当的关键所在。

DeepSeek并非传统意义上的科技企业,却以远低于美国大型模型公司所使用的GPU资源和成本,成功研发出极具创新性的模型。

其R1模型的训练成本仅为560万美元,这一数额甚至不及Meta GenAI团队中任何一位高层管理人员的年薪。

图片

背后幻方量化的投资布局考量

梁文锋,作为两家资产规模达百亿的量化私募机构——浙江九章资产管理有限公司和宁波幻方量化投资管理合伙企业(有限合伙)的实际控制人,同时也是DeepSeek的创始人。

梁文锋自浙江大学电子工程系AI专业毕业后,曾涉足与专业不直接相关的金融科技行业,专注于私募基金和量化投资领域多年。

作为量化投资领域的资深私募公司,幻方量化自2015年成立以来迅速崛起,成为行业的领头羊,管理规模一度突破千亿人民币。

作为私募公司,幻方量化必须通过量化投资业务实现盈利,以保障公司的持续运营和发展,包括为DeepSeek的研发提供资金支持。

在量化投资领域,公司运用先进的量化策略,结合AI技术对大量金融数据进行分析和建模,制定精确的投资决策,在过去的市场表现中取得了显著的业绩。

在2016年,幻方量化推出了首个基于深度学习的交易模型,并开始将GPU引入计算交易仓位。

此后,梁文峰不断扩大AI算法研究团队,将AI技术深度融入金融投资量化策略中,逐步取代了所有传统模型。

至2017年,幻方宣布其投资策略已全面AI化。

至2019年,幻方量化成为中国首家募资超过1000亿元人民币的量化基金。

幻方量化自2019年起开始囤积GPU,至2021年,在中国拥有1万张GPU的企业寥寥无几,而拥有1万张英伟达A100芯片的公司仅幻方量化一家。

随着幻方量化囤积GPU规模的不断扩大,幻方开始成立专门的AI研究公司。

2019年推出萤火一号AI集群,2021年又投资10亿人民币,研发萤火二号以提供算力支持,可见在技术层面,幻方量化把握住了市场机遇。

在美国于2022年对中共实施芯片制裁之前,幻方量化已大规模购买英伟达芯片,为后续产品的面世奠定了重要基础。

2023年7月,梁文峰宣布正式进军通用AIAPI领域,创办了DeepSeek,仅用10个月时间,至2024年5月,DeepSeek推出了version2模型。

DeepSeek的成立标志着幻方量化从量化投资向AI技术的深度转型。

通过DeepSeek,梁文锋不仅在AI领域取得了显著成就,还为幻方量化在量化投资领域提供了更强大的技术支持。

作为国内领先的量化投资机构,幻方量化自成立以来,一直致力于运用机器学习和全自动量化交易推动国内量化投资的发展。

随着AI大模型在国内的迅速崛起,业界流传着一种说法:在中国,拥有最多高性能GPU的机构并非AI公司,而是幻方量化。

资金雄厚、不吝啬的幻方量化在背后支持DeepSeek进行模型研究,其研究路线坚持开放源代码,且并不急于将研究成果商业化应用。

据接近DeepSeek管理层的内部人士介绍,梁文锋已个人投资于一些未来可能在DeepSeek模型基础上发展起来的下游AI应用企业项目。

这表明梁文锋正在为DeepSeek未来构建一个小型生态系统而提前进行布局。

图片

对英伟达等科技巨头的潜在影响

美国财经杂志《财富》发出警告,指出DeepSeek正对英伟达在AI领域的主导地位构成威胁。

正如先前所述,DeepSeek已经推出了采用性能较低、成本更为经济的芯片的最新产品系列,此举对英伟达施加了压力。

有观点认为,这可能导致其他大型科技公司减少对英伟达更高端产品的采购。

AvaTrade的首席市场分析师凯特·利曼在接受《财富》杂志采访时指出:[投资者对DeepSeek利用性能较弱的AI芯片的能力表示担忧,这可能会影响英伟达在AI硬件市场的主导地位,尤其是考虑到其估值在很大程度上依赖于AI领域的需求。]

值得注意的是,据tomshardware的报道,DeepSeek在AI技术上的突破并未采用英伟达的CUDA平台,而是选择了类似汇编语言的PTX编程方式,这在一定程度上加剧了业界对英伟达未来发展的忧虑。

由于受到DeepSeek的冲击,美国芯片行业巨头英伟达的股价在当日暴跌约17%,博通公司的股价也下跌了17%,AMD的股价下跌了6%,微软的股价下跌了2%。

美国联合能源公司的股价下跌了21%,而Vistra的股价更是下跌了29%。

幻方量化,一家专注于量化投资的公司,早已洞察到AI算力需求的潜在泡沫。

传统AI训练对算力的需求巨大,而英伟达的芯片作为算力的核心,其重要性不言而喻。

然而,DeepSeek的问世使市场认识到,AI对算力的需求并非如先前所预期的那样庞大。

DeepSeek的开源旨在向公众证明,AI实际上仅需原先算力的十分之一。

这一举措进一步加剧了英伟达股价的下跌风险。

图片

若DeepSeek未能达到预期效果,或市场反应不及预期,英伟达的股价可能不会下跌,甚至可能上涨。

从技术竞争角度看,DeepSeek的低成本、高效能技术路径如果被广泛应用,可能会减少市场对英伟达高端GPU的依赖,理论上存在促使幻方量化做空英伟达以获取利益的动机。

但幻方量化此前囤积了上万张英伟达 A100 和 H800 芯片,这些芯片是其技术研发的重要基础,与英伟达也存在着一定的合作关系,这又使得其做空英伟达的行为存在诸多矛盾之处。

尽管目前缺乏明确证据证明幻方量化对英伟达进行了做空操作,但DeepSeek在技术上的突破对英伟达市场地位可能产生的影响,无疑已经引起了市场的广泛关注。

根据券商中国的报道,摩根士丹利在其最新研究报告中宣布,将2025年英伟达GB200的预期出货量从先前的3万至3.5万件大幅削减至2万至2.5万件,最悲观的预测显示出货量可能不足2万件。

此次预期下调可能会对GB200供应链市场造成300亿至350亿美元的影响,给相关供应链及半导体行业带来沉重压力。

摩根士丹利指出,市场对于大型语言模型(LLM)的效率存在争议,例如DeepSeek与微软之间的分歧,预计这些争议在2025年仍将持续,这将使得市场难以对这些股票的价值进行重新评估。

此外,依据周期性规律,云计算行业的资本支出增长速度可能在2025年第四季度减缓至个位数百分比。

尽管如此,摩根士丹利预测,如果历史周期性规律重演,这一增长周期可能会持续至2025年上半年。

随着市场逐渐接近周期顶峰,预计2025年第四季度,同比增长速度将减缓至个位数。

投资者对GB200供应链股票的预期增长过高,可能会对高市盈率的云计算股票产生负面影响。

图片

结尾:技术革新的路径预计将产生影响

①AI初创企业的运营模式将经历转变:那些依赖昂贵GPU集群的AI企业可能会因为成本上的不利地位而面临破产风险。

这将导致二手市场GPU供应量的大幅增加,而中小规模的AI企业则更可能倾向于采购价格更为低廉的低端GPU。

②硬件需求也将经历结构性的转变:自去年以来,以训练为主导的算力需求已经开始向推理侧转移。

未来这种趋势预计将会持续,众多中小AI企业将不再致力于训练基础模型,而是转向采用DeepSeek这类开源模型。

此外,英伟达在训练市场的主导地位也将面临重新评估。

部分资料参考:极客公园:《Deepseek又出连招:刚发布了超越DALL-E3的多模态模型》,字母榜:《DeepSeek推翻两座大山》,量子位:《[DeepSeek甚至绕过了CUDA],工程师灵魂提问:英伟达护城河还在吗?》,Meta财经:《关于幻方私募:当AI算法走进量化世界,无痛[躺赢]?》,私募排排网:《DeepSeek背后的百亿私募大佬基金业绩如何?》,经济观察报:《雷军都来挖人,这家公司想把1%的AI天才藏起来》,半导体行业观察:《成就DeepSeek奇迹的芯片,敲响英伟达警钟》,贝壳财经:《DeepSeek崛起,英伟达暴跌》,华尔街见闻:《DeepSeek最强国产大杀器?英伟达一家就没了近4.3万亿》,甲子光年:《英伟达市值蒸发创纪录,DeepSeek掀起AI算力革命意味着什么?》

       原文标题 : AI芯天下丨产业丨DeepSeek的压力给到华尔街,掀起蝴蝶效应

声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

    扫码关注公众号
    OFweek人工智能网
    获取更多精彩内容
    文章纠错
    x
    *文字标题:
    *纠错内容:
    联系邮箱:
    *验 证 码:

    粤公网安备 44030502002758号