英伟达GTC 2025主题演讲核心内容总结
一年一度的GTC(GPU Technology Conference)又召开了,这个会算是英伟达的AI传教会了,不过又有点类似于武林盟主召开的武林大会,毕竟科技界的各路都来了,不但Meta,Open AI等科技企业,还有UC Berkeley等学术机构,最重要的是非常多的例如理想、小米、商汤、Rivian、Wayve国内外汽车智能企业参加。本次GTC, 黄仁勋的两小时演讲强调了 Nvidia 系统支持的 AI 应用的广度。黄仁勋详细阐述了 Nvidia 在自动驾驶汽车、更好的无线网络和先进机器人技术发展方面的贡献。他还列出了公司未来两年的产品路线图。
本文将结合英伟达黄仁勋在 GTC 2025主题演讲的核心内容总结,帮助大家了解英伟达的 AI帝国,启发和畅想下在英伟达生态下的AI应用和发展。万物皆可“Token” - AI is everything在互联网数字时代,我们的信息都可以转成01的数字代码。而现在我们身处生成'token*'的前沿时代(*AI的基本构建单元),它们开启了一个可能性无边的新世界。这些token正在将:科学洞察转化为图像——描绘外星大气层数据,指引未来探索者原始数据转化为前瞻预判——让人类为下一次挑战做好准备物理定律解码重构——推动我们走得更快、更远,例如我们的Physical AI 自动驾驶,机器人。生命密码破译应用——在疾病显现前发现隐患
从数字的Agentic AI 数字信息生成到与物理世界的人交户的Physical AI 万物皆可“Token”,AI 成为数字时代的引擎,把数字时代带入AI 时代。AI工厂:计算范式的革命而面对万物皆可“Token”的背景下,AI 工厂将引导硬件的革命,我们需要怎样的AI 计算单元?从检索到生成:AI工厂不再是存储数据的仓库,而是通过生成式AI实时生产“token”(信息单元)的智能引擎。规模化挑战:未来数据中心需处理指数级增长的推理需求(如Agentic AI生成数千个中间token),需要AI算力芯片的架构和冷却技术来支撑超大规模部署。
经济模型变革:AI工厂的收益与“token生成速度×吞吐量”直接相关,能源效率(每瓦特token数)成为核心竞争力。AI 应用潜力巨大的市场外加新型计算范式的革命,英伟达给出的解药是什么呢?怎么帮助大家更好的应用呢?新一代GPU Blackwell登场老套路了,每一次GTC Jenson 都要发布或者透露下他的看家本领GPU新架构。Blackwell架构:采用革命性设计,集成2080亿晶体管,支持高达20 petaflops的AI计算性能,比前代Hopper提升25倍能效。
其中有三大关键突破:推理性能飞跃:通过MVLink高速互联技术,实现72个GPU的无缝协同,解决大模型推理时的内存与带宽瓶颈。动态资源分配:结合Dynamo操作系统,灵活分配算力用于“预填充”(上下文理解)和“解码”(生成答案),优化AI工厂效率。4-bit浮点量化:显著降低能耗,支持更复杂模型的实时推理。最重要的是,这次Blackwell真正要加速量产了。英伟达AI芯片未来路线图2025 下半年:Blackwell Ultra上市,性能再提升50%。2026:Vera Rubin架构(CPU+GPU协同设计)Vera 为 Nvidia 设计 的CPU,HBM4内存与硅光子网络(1.6T CPO)登场。包含 144 个独立的 Nvidia GPU。2027: Rubin Ultra架构,包含 576 个GPU,实现单机柜15 exaflops算力,支撑百万GPU集群。2028 年某个时候 Feynman 推出。
有了这个强大AI算力芯片的加持,英伟达表示继续推动AI计算范式的革命.软件生态:CUDA-X与Dynamo本次会议,英伟达推出了两个软件生态,帮助大家容易部署算力硬件的软件。CUDA-X加速库:大家都熟悉英伟达的CUDA,大家一般把他理解为算子,CUDA 是基础层:提供 GPU 编程模型(线程层次、内存管理),开发者这利用CUDA去开发AI应用。
这次,英伟达推出的CUDA-X, CUDA-X可以理解成上层建筑:基于 CUDA 封装领域专用优化,类似“工具箱”。可以帮助开发者将 GPU 的暴力算力转化为行业生产力。它让开发者无需成为硬件专家,即可在 AI、科学、工业等领域实现“性能自由”,是加速计算时代的核心基础设施。CUDA-X加速库覆盖科学计算、5G、量子化学等领域,如cuQuantum加速量子模拟,cuLitho革新半导体光刻。
Dynamo操作系统:专为AI工厂设计,动态调度GPU集群资源,支持万亿参数模型的分布式训练与推理,实现“一个GPU巨脑”。而起这还是一款开源软件,英伟达表示该软件可以提高人工智能推理的效率并降低成本。机器人技术:物理AI的突破Nvidia 首席执行官黄仁勋在 GTC 主题演讲中宣布了一种基于 Llama 的新型企业推理模型,该模型名为 Nvidia Llama Nemotron Reasoning。
称其为“任何人都可以运行的令人难以置信的新模型”,超越了 DeepSeek。它是 Nvidia Nemotron 系列模型的一部分,旨在增强Agentic AI的开发。按照Jenson的路径图,除了Agentic AI,Physical AI 还有巨大开启空间,具体Physical AI 方面怎么让大家快速上手?Nvidia 发布所谓的人形机器人 AI 基础模型,名为 Groot N1,是一款“通用”模型,基于生成式AI和强化学习,具备多任务泛化能力,通过Omniverse数字孪生生成海量训练数据,可以很快部署机器人。
让天下没有难做的智能人形机器人的 GrootNvidia 声称,Groot N1 具有“双系统架构”,可实现“快速和慢速思考”,灵感来自人类的认知过程。Groot N1 现已开源。也就是说,英伟达通过 Groot开源生态:开发者可基于GROOT快速定制机器人技能,那么做个机器人跟大家现在做一款手机那么容易了。
行业合作与未来愿景对于汽车行业的自动驾驶,英伟达提供从云端算法训练,验证虚拟仿真,车端新品NVIDIA全套方案,本次GTC Jenson 黄并没有提太多,大家可以看我们之前文章《AI 巨头 Nvidia 英伟达在汽车领域做什么?》了解。但这次会议,英伟达推出了 NVIDIA Halos,一款适用于自动驾驶汽车的全栈综合安全系统,NVIDIA 将其安全 AV 开发技术套件从云端到汽车统一起来——涵盖车辆架构到 AI 模型——包括芯片、软件、工具和服务。
这样可以简化自动驾驶开发流程和时间,但坏处就是以后需要买英伟达的全家桶。此外,Jenson 发布了一个重磅消息,那就是通用汽车(GM)投奔到英伟达怀抱了,要知道之前通用智能驾驶一直采用Mobileye 和 高通系列芯片。通用汽车(GM)将采用NVIDIA全套方案(训练、仿真、车载芯片),推动自动驾驶落地。
边缘计算:与思科、T-Mobile合作构建AI边缘网络,优化5G基站智能调度。数字孪生:Omniverse平台助力设计AI工厂,模拟能耗、散热与网络拓扑,降低万亿美元级数据中心建设风险。量子计算:推出CUDA-Q量子-经典混合计算框架,加速算法研究。核心洞察按照英伟达的发展和眼光:AI工业化:计算从“通用”转向“专用”,AI工厂成为新基建核心。能源为王:未来数据中心收益由能源效率决定,液冷与硅光子技术是关键。机器人爆发:物理AI+生成式训练开启人形机器人商用元年,弥补全球劳动力缺口。NVIDIA正通过“芯片+软件+生态”三位一体,推动从云到边缘、从数据到物理世界的全栈AI革命。总结起来,英伟达让天下没有难做的AI和机器人。
未经准许严禁转载和摘录-参考资料:
英伟达 GTC 2025 keynote 演讲PPT以及视频
原文标题 : 马云开这次 GTC 标题肯定是“让天下没有难做的AI和机器人” - 英伟达GTC 2025主题演讲核心内容总结

最新活动更多
-
3月27日立即报名>> 【工程师系列】汽车电子技术在线大会
-
4月1日立即下载>> 【村田汽车】汽车E/E架构革新中,新智能座舱挑战的解决方案
-
4日10日立即报名>> OFweek 2025(第十四届)中国机器人产业大会
-
即日-4.22立即报名>> 【在线会议】汽车腐蚀及防护的多物理场仿真
-
4月25日立即报名>> 【线下论坛】新唐科技2025新品发布会
-
7.30-8.1火热报名中>> 全数会2025(第六届)机器人及智能工厂展
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论