订阅
纠错
加入自媒体

英伟达跌到,DeepSeek吃饱

2025-03-03 15:46
诗与星空
关注

2025年2月27日,英伟达发布了2025财年第四季度财报。          

公司报告称,Q4收入达到了393亿美元,其中净利润220.91亿美元,同比增长80%。调整后的每股收益为0.89美元,均超过了分析师预期的380.5亿美元和0.84美元。此外,英伟达预计第一季度收入将达到430亿美元,远高于分析师预测的417.8亿美元          

全年收入创纪录达到1305亿美元,同比增长114%。

然而,英伟达股价当天却暴跌!          

股价下跌8.48%,创下一个月来最大单日跌幅,市值蒸发约2716亿美元(约合1.98万亿元人民币)。          

发生什么事了? 

一周前,DeepSeek发布公告,称将迎来“开源周”。  

意思是未来一周每天发布一部分开源技术,模仿起了OpenAI的骚操作。 

不过,和OpenAI挤牙膏不同的是,DeepSeek放出的每一个开源工具都是刺向英伟达的刺刀,刀刀见血。          

 

让我们看看这个周,DeepSeek都开源了些啥。          

我尽量用大家都能看得懂的大白话描述。

首日:FlashMLA横空出世,GPU算力调度迎来智能时代  

FlashMLA的发布犹如一颗重磅炸弹,直击AI算力浪费的痛点。传统GPU在处理自然语言等任务时,面对长短不一的数据序列往往"大材小用",造成算力浪费。FlashMLA则如同一位智能交通调度员,能够根据序列长度动态调配计算资源,实现"精准打击"。这一创新不仅大幅提升GPU利用率,更被业界视为国产GPU性能突围的关键一步。发布仅6小时,GitHub收藏量便突破5000次,其影响力可见一斑。

次日:DeepEP打通MoE模型任督二脉,通信效率飙升

MoE(混合专家模型)作为AI大模型的重要架构,其训练和推理效率高度依赖专家模型间的通信效率。DeepEP作为首个开源EP通信库,为MoE模型量身打造了一条"数据高速公路"。它支持优化的全对全通信模式,并原生支持FP8低精度运算调度,在降低计算资源消耗的同时,实现数据的高速传输。DeepEP的出现,让MoE模型的训练和推理效率迈上新台阶。

第三日:DeepGEMM剑指矩阵计算,FP8性能突破天际  

矩阵乘法是AI计算的基石,其性能优化直接影响大模型的训练成本和效率。DeepGEMM凭借DeepSeek-V3的细粒度scaling技术,仅用300行代码便实现了高效的FP8通用矩阵乘法。在Hopper GPU上,其计算性能最高可达1350+ FP8 TFLOPS,媲美甚至超越专家调优的库。更令人惊叹的是,DeepGEMM无需编译,通过轻量级JIT模块即可实现运行时编译,极大降低了使用门槛。 

第四日:DualPipe+EPLB双剑合璧,并行计算效率飙升30% 

并行计算是提升AI算力的重要手段,但传统管道并行存在"气泡"问题,造成资源浪费。DualPipe通过双向管道并行算法,实现计算与通信阶段的双向重叠,将硬件资源利用率提升超30%。EPLB则针对MoE架构,通过冗余专家策略和启发式分配算法,优化GPU间的负载分布,减少GPU闲置现象。两者相辅相成,为AI大模型训练注入强劲动力。 

第五日:3FS文件系统横空出世,数据访问速度再创新高

AI模型的训练和推理离不开海量数据的快速访问。3FS文件系统专为现代SSD和RDMA网络带宽设计,能够实现高速数据访问,显著提升AI模型训练和推理的效率。它的出现,为AI算力瓶颈的突破再添一把利器。

不难发现,这五天发布的开源项目,几乎每一个都最大限度的压榨N卡的性能。

这也是为什么DeepSeek能用几千张卡训练出的大模型,能和OpenAI几万张卡Grok几十万张卡的效果打的有来有回。 

要命的是,这些技术统统开源,人人可用。          

如此一来,大模型企业不需要这么多卡了。          

英伟达的高估逻辑发生了变化。   

DeepSeek的母公司是幻方量化,作为一家量化公司,你猜会不会提前做了操作?

       原文标题 : 英伟达跌到,DeepSeek吃饱

声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

    扫码关注公众号
    OFweek人工智能网
    获取更多精彩内容
    文章纠错
    x
    *文字标题:
    *纠错内容:
    联系邮箱:
    *验 证 码:

    粤公网安备 44030502002758号