订阅
纠错
加入自媒体

Gork-3语音功能上线!马斯克揭秘百天搭建超算中心

2025-02-25 10:03
硅兔赛跑
关注

 作者|Cora 编辑|Evan

Gork-3背后,是马斯克资源整合能力的展现。今天,由xAI开发的Grok APP推出了实时语音模式,共支持10种模式,用户可通过语音与AI对话甚至电话式沟通,进一步提升Grok系列大模型信息交互体验。

就在前不久,2月20日上午,Grok 3宣布向x用户免费开放。xAI发帖称,世界上最聪明的AI Grok3现在免费提供(直到我们的服务器崩溃)。

此前,马斯克带着xAI首席工程师Igro、研究工程师Paul、推理工程师Tony在社交媒体X上直播发布最新AI大模型Grok-3,引发700万人次观看。

发布当天,xAI称在数学、科学和编码基准测试中,Grok-3击败了OpenAI的GPT-4o、谷歌的Gemini、DeepSeek的 V3模型和Anthropic的Claude。马斯克称Grok-3在很短的时间内比Grok 2性能提高了一个数量级,为“地球上最智能的AI”。此次,xAI还通过Grok-3推出了一款新的智能搜索引擎DeepSearch,可以直观展现自己理解题目,表达其理解查询的过程以及计划响应的方式。

马斯克特别强调到目前该模型只是测试版本,后续将不断改进模型。“几乎每24小时,你就能看到改进版本。” 据悉,马斯克的xAI正洽谈一轮融资,筹资约100亿美元,估值约为750亿美元。据PitchBook数据,目前该公司的最新估值约为510亿美元。同时,马斯克旗下社交媒体X正洽谈以440亿美元的估值筹集资金。现在,X Premium+和SuperGrok用户将享有更高的访问权限,并可抢先体验语音模式等高级功能。Grok3体验地址:https://x.com/i/grok

马斯克如何在122天内打造最大数据中心集群?

马斯克在40分钟的直播中花费了十几分钟详细介绍了自己是如何搭建起建数据中心集群。

马斯克提到训练Gork-2时,大约花费了6500张H100处理器,他们为Gork-3准备了10万GPU。尽管马斯克能够在极短的时间内筹备出10万张GPU,但是,xAI团队仍需要解决能源、场地等一系列问题。

“在122天内,我们能够让10万个GPU处理器运转起来。我相信,这是同类中最大已经投产的H100集群。”Igro补充道。在随后92天时间里,xAI又投入了10万个GPU,并加速推出了Gork-3。

首先是他们急需寻找一个工厂。因为新建工厂时间肯定来不及,所以他们优先选择一些已有的,且废弃的工厂。最后,他们选择了马斯克数据中心集群主要位于美国田纳西州孟菲斯市。

围绕着工厂,他们接下来需要解决数据中心的能源问题。为了赶进度,xAI马不停蹄地推动数据中心运转,甚至一开始租借了非常多的发电机,以及一些发电车来保证数据中心的运转,直到整个工厂的电力系统搭建完善,接入公共电力体系。

在试运行电力阶段,xAI发现超算中心的电力时十分不稳定的,GPU集群所承载的电力会非常波动,会经常造成发电机故障。为了解决这一难题,xAI特别借用了特斯拉的团队,最后选择采用了Megapacks方式来平滑整个电力使用,形成较为稳定的电力运载系统

现在数据中心的电力并不维持在某一两个开关上,xAI团队对整个数据中心集群重新设计。“具体而言,我们现在数据中心厂房构建方式相对特殊,走进我们厂房里,你拉掉几个电缆线,数据中心仍然能够正常运行。这可能是大多数数据中心团队并不会关注的。”Paul说道。

解决了电力,就要开始管理网络的事情。在数据中心搭建阶段,马斯克提到团队曾在凌晨四点去解决网络连接设备不匹配等问题。

数据中心运作的时,为了解决冷却问题,马斯克谈到自己几乎租用了1/4的美国移动冷却设备,来保持厂房内温度正常,并设立重新搭建了完善的液冷系统

马斯克在122天内迅速搭建成了一个集成10万GPU的超算中心。同时,在92天时间内又将该数据中心扩大了一倍。从马斯克的讲述中,我们可以看到打造一个真正的数据中心,并不容易,但其强大的资源整合能力,实现这一目标。

马斯克旗下的xAI在落后微软、Meta、OpenAI几个月时间内,仍然能够推出Gork系列模型,并且迅速训练出Gork-3赶上AI大模型第一梯队。可以看出,快速的响应能力、强大的资源支持,优秀的人才团队都是xAI在AI大模型竞争中的优势所在。

亲自体验Grok-3!9.11还是比9.9大?

据直播透露,Grok-3在所有性能、所有分类上均比Grok-2高上10倍。

尽管目前模型还在测试阶段,但在数学、科学和编码基准测试中,Grok-3得分高于OpenAI的GPT-4o、谷歌的Gemini、DeepSeek的V3模型和Anthropic的Claude。OpenAI联合创始人、AI大牛Andrej Karpathy曾在 X 上发布了对模型的初步感受,并写道“感觉它堪比OpenAI最强大模型的领先水平”。

直播中,首席工程师Igro回应了此前的网友猜测,chocolate模型正是Grok-3的原型,在盲测过程中获得了1400分,受到不少用户的喜爱。

为了体验Grok-3的推理能力,xAI让Grok-3做一份火星移民计划,问其人类如何能从火星到地球,并从地球回火星,并形成3D动画图。Grok-3收到指令后马上开始了思考,作为最新具有推理能力的模型,Grok-3同样能够将思考的过程展现给用户。

但这并非完全展示,马斯克提到为了避免核心逻辑被“抄袭”,他们也将思考的过程做了一部分屏蔽。

同时,xAI还给了Grok-3另一个新的指令,也是xAI内部成员最喜欢xAI做的事情之一——创造一个颇具创新的游戏,要求集合连连看和俄罗斯方块两种玩法。大约十几分钟后,我们也看到了相关的游戏生成,并且成功运转。

在我们实际测试中发现,Grok-3的数学水平忽上忽下。比如说,在我们2月20日体验的时候,Grok-3仍然分不清9.9和9.11谁大谁小。

但是,如果你在Grok-3中选择DeepSearch的话,Grok-3则会从数十个页面中选择各种信息综合分析,最终给出更为全面的答案。

Grok-3最为出名的则是其数学、科学等领域的思考能力。我们选择了一道全球奥林匹克竞赛题提问Grok-3。很遗憾的是,无论是Grok-3,还是DeepSearch版本,答案均错误。

Gork大模型将冲击图灵奖?xAI首次发布AI agent

正当首席工程师Igro想要介绍Grok-3时,马斯克颇有闲心谈起来Grok的取名由来。Gork原来是一本小说《Strange Land》里的一个火星人的名字,Gork本身也代表着深刻理解某件事。看起来,老马在哪里都不忘他的火星梦。

研究工程师Paul提到,距离Gork-1发布时间刚刚过去17个月,但Gork系列模型的性能却已经追上全球第一梯队大模型的水平,与OpenAI的4o模型不相上下。

“我们17个月前发布Gork-0基本什么都不懂,17个月后我们终于有一个孩子终于从高中毕业了。现在我们的孩子终于要准备上大学了。”Tony说道。马斯克说到未来AI能够获得一些大奖,如图灵奖或者诺贝尔奖等。这或许也能较为真实反映出Grok-3目前的数学水平,和高考生相似。

 xAI认为,仅仅有最强的预训练模型,也不足以建立最佳AGI。“最佳的AGI需要像人类一样能够思考,能够自我批判,验证所有的解决方案,且还要从第一性原则中思考。”Igro说到。为了达到目的,xAI将预训练模型和强化模型放在一起训练,激发模型本身的强化推理能力。同时,在xAI内部还有一个被称为“Big brain”的模式,能够激发Grok-3拥有更多思考能力。

Grok-3目前有Resoning Beta和mini两种型号,其中小模型mini模式下,能够更快反应,同时其回答质量也能和Resoning Beta在同一水准内。

Gork-3是xAI在推理模型上走出的第一步,尽管该模型仍处在完善阶段,但xAI仍凭借Gork-3赶上了推理模型第一梯队。同时,在直播中xAI将Agent列为自家大模型系列的下一步,并推出了Deep Search产品。

 该产品主要帮助工程师、科学家、程序员们进行代码编辑。“有点像是下一代搜索引擎,你可以向其发出提问。”Paul介绍道。

此次直播最后回到用户提问环节,xAI谈及了开源问题。一般来说,xAI会在正式推出下一代大模型时候,会选择开源上一代模型。xAI在直播时也回应到,当Gork-3正式推出后,同样会开源Gork-2。

       原文标题 : Gork-3语音功能上线!马斯克揭秘百天搭建超算中心

声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

    扫码关注公众号
    OFweek人工智能网
    获取更多精彩内容
    文章纠错
    x
    *文字标题:
    *纠错内容:
    联系邮箱:
    *验 证 码:

    粤公网安备 44030502002758号