订阅
纠错
加入自媒体

【年度专题】XR终端,能否吃到AI落地的最佳红利?

2025-01-23 14:50
VR陀螺
关注

文/VR陀螺 万里

不出意外,刚结束的2024年又是被AI狠狠刷屏的一年。

这一年以来,AI曾助推微软以及英伟达先后登上了全球市值第一的宝座;诺贝尔物理学奖、化学奖两大重磅奖项均与AI相关,另据CB Insights数据显示,今年Q3季度,全球有接近1/3的风投都流向了AI初创企业。

在XR领域,那些已经落地亦或是正在筹备的终端产品当中,里面均能看到AI的身影,而AI功能也将成为后续MR、AR硬件的核心用例之一。本文将回顾这一年以来AI的应用落地盛况。

 两件大事:AI眼镜起风、两款AR新品 

如果说2023年对于理想AI硬件形态仍有不少争论,那么到了2024年,指向性已经明确了许多。

去年开春曾有三大重磅AI终端产品:Ray-Ban Meta、Humane Ai Pin以及Rabbit R1,它们分别是眼镜形态、胸针形态以及手持设备形态,从销量以及用户反馈来看,眼镜形态的Ray-Ban Meta均位于前列。此外,Ray-Ban Meta已经于去年销量突破100万台,得到了市场初步验证。

另外,我们也可以观察这一年以来一众头部AI巨头的硬件布局以及发声:

7月,比尔盖茨出席博客节目《the Next Big Idea》时曾提到,未来AI Agent的理想硬件形态可能包括耳机以及智能眼镜两种。

9月,Meta亮相了其首款AR眼镜Orion,扎克伯格表示早在2014年团队便萌生了构建下一代计算平台的想法,这一硬件是眼镜,它可以实现全息显示以及AI助理两大能力。“眼镜具有独特的优势,可以让人们看到你所看到的,听到你所听到的。它们会给你非常微妙的反馈。”

11月,Meta前硬件硬件主管Caitlin Kalinowski跳槽到了OpenAI,Kalinowski曾负责了Orion、Ray-Ban Stories等项目。外界有猜测这是OpenAI布局AR眼镜赛道的举措之一。

12月,谷歌发布Gemini 2.0以及最新AI助手Project Astra,在DeepMind官网,智能手机以及智能眼镜是唯二两款与Project Astra集成的硬件设备。

国内市场,今年9月,字节跳动完成对OWS耳机品牌Oladance的收购,传内部正在开发AI眼镜。

今年11月,百度亮相AI眼镜,也有传言称小米正在开发AI眼镜产品并计划于明年发布。

可以发现,这几家头部企业矛头所指、寄望于承载未来AI Agent体验的均为眼镜设备。那么眼镜设备的优势在哪里?

在笔者看来,理想的AI硬件需要满足全天候陪伴、时刻洞察用户意图、交流私密等特性,经过这几个条件筛选,眼镜、AI耳机、类似Humane Ai Pin的可穿戴设备会是潜在选择。在这其中,眼镜是综合之选,原因在于它兼顾了优秀的可穿戴属性。此外,眼镜里面还可以进一步添加微显示屏,以补齐视觉信息传输媒介。

当然,从今年市场的新品数量以及热度来看,眼镜已然成为了里面的最大赢家。此前VR陀螺曾统计,截至11月底,公开入局AI眼镜的数量已经达到了36家,产品数量预计超过了50+。此外,在CES期间,我们又可以看到系列AI眼镜新品的亮相,如Halliday、雷神科技、XPERT等。

不难预见,新的一年当中,VR/AR行业的一大重要看点是“百镜大战”,而在这其中国内的战况尤为激烈。

Ps:2024可能是眼镜类产品在命名上最为混乱的一年,去年年初,笔者曾习惯于用智能眼镜称呼Ray-Ban Meta这一类不带屏幕的产品,而AR眼镜则是带光学显示的设备。随着“AI含金量”日益提升,市场上又衍生出了“智能音频眼镜”、“拍摄眼镜”、“AI眼镜”、“AI+AR眼镜”等多个版本。如何让有关文章不引起歧义,成为了我这一年以来最为头疼的事情之一。(这里再强调一遍,AI眼镜指的是搭载AI功能但缺乏显示的设备,AR眼镜则在AI眼镜基础之上叠加了显示屏幕)

从当前来看,需不需要为眼镜引入光学屏幕(此时便成为了AR眼镜)仍是一个值得探讨的问题,原因在于单从市场表现来看,没有屏幕的眼镜产品似乎更受欢迎,原因在于它可以更好控制设备外形体积,此外没有显示模组价格也可以更友好。

但不可否认的是,从长远来看,AR眼镜是AI眼镜的发展必然,并且也将是此类产品的最终形态。在这一年中,海外的Snap以及Meta为AR眼镜产品打了个样。

Spectacles 5:虽然该产品只面向开发者推出,不过产品完成度已经达到了较高水平,眼镜为一体式形态,运行Snap OS系统,支持手势交互。其他方面,Snap已经推出了AR创作平台Lens Studio 5.0,并通过与OpenAI合作的方式为眼镜引入了AI能力。

Spectacles 5,图源:网络

Meta Orion:这可能是当前市面上做得最为极致的AR眼镜,它的重量控制在了100g以内,外形趋近于普通AR眼镜,并且提供了一整套完备的交互解决方案。在光学选择上,Meta押注Micro-LED+光波导,基于碳化硅波导将FoV提升到了70°。这款产品代表了Meta长期AR愿景的集中展示,只不过想要在消费市场落地还有一段距离。

Meta Orion,图源:网络

 AI+AR:多模态AI上车,今年关键词会是“端到端”以及记忆能力 

如果在2023年,可能很多人仍会好奇AR眼镜的使用场景甚至杀手级用例是什么,而到了现在,答案已经逐渐明朗,那便是AI。围绕AI,今年国内外AR厂商逐渐加码,类似的报道屡见不鲜:

Meta坚定押注AI大模型并积极提升背后的基础设施建设,并表示到“到2024年底,我们的目标是拥有350000个NVIDIA H100 GPU”;近期也有消息称,字节跳动计划2025年斥资至多70亿美元购买英伟达芯片;而小米集团近期也高调宣布开出千万年薪挖角AI人才等。

如果从AI应用场景来看,目前的AR眼镜功能已经逐步趋同,如AI助手已经成为了很多眼镜产品的标配,这背后能力高低则主要取决于调用的大模型。此外,常见的AI功能还包括提词翻译、会议纪要等。

除了常见的功能场景外,这里进一步列举几个去年曾出现的AI眼镜产品的创新用例:

星纪魅族StarV Air2与手机系统打通,如可以实现眼镜、手机同时双向显示翻译内容等多多端流转体验;

Rokid Glasses为盲人打造了基于多模态AI的无障碍模式;

影目科技INMO Go 2实现了离线翻译;

闪极「拍拍镜」A1引入了AI记忆系统,可以记住用户的各种图像语音信息。

雷鸟V3拍摄眼镜开发了AI电台功能,基于摄像头识别周围环境并同步播放相匹配的音乐。

雷鸟V3拍摄眼镜的部分创意用例,图源:雷鸟创新

2024年年初,笔者曾在年度回顾中曾提到了“多模态AI”将成为AI眼镜的标配,并预言“AR眼镜产品的摄像头将会成为至关重要的模组之一,摄像头或许会在AR眼镜上率先落地,其优先级甚至会高于光学屏幕。”

现在再来回看,多模态AI的确成为了AI眼镜的一大重要卖点,如Ray-Ban Meta于十二月推送了实时人工智能,AI具备了理解实时视频的能力;而近期发布的XREAL One虽然表示不盲目跟风AI,但也同样配备了一颗摄像头外设以用于多模态AI拓展。

那么在新的一年中,AI眼镜又会有何新趋势?

图源:星纪魅族

在体验方面,眼镜的AI功能上限无疑直接取决于AI大模型的能力上限。这一年以来AI大模型的各项能力屡创新高,早些时候,我们仍多以“专家水平”来评价一款出色的AI大模型,而现在随着GPT-o3等产品的出现,它似乎已经达到了“博士级别”。

对于这类层出不穷的AI大模型,笔者也已经很难用常规的问题来判别它们AI能力的高低。在这种情况下,我认为AR眼镜后续应该卷AI能力包括响应速度、个性化能力等,因为这些指标的提升对于当前用户感知会更加明显。

端到端对话。在AI眼镜兴起初期,笔者曾陆陆续续体验了不少同类型产品,当时的痛点主要有几个,一是调用AI语音电话时手机APP需要在前台并且无法熄屏,二是AI响应速度太慢,往往长达数秒,这很容易让人失去使用的欲望。

去年GPT-4o的发布无疑是一个重要的转折,因为它在语音对话方面具有“断档式”领先优势,平均响应速度为320ms,对话可以随时打断、系统可以理解用户的情绪语气,这已经与与人类日常对话体验十分接近。

这种极低水平的延迟背后得益于模型的端到端训练,即所有输入和输出都由同一个神经网络处理。今年以来,国内不少厂商其实也看到了端到端AI模型(特别是语音对话式AI)的好处,纷纷展开了相应的研究。如科大讯飞于去年8月发布的星火极速超拟人交互技术背后应用到了端到端的统一模型框架;而豆包于12月份的火山引擎Force大会上也宣布豆包端到端实时语音模型即将上线。预计在新的一年当中,“端到端”将会成为AR眼镜更为高频的词汇。

图源:科大讯飞

个性化AI。AI Agent是很多人对于AI的终极幻想,与PC、手机等关注生产力场景的终端不同,AR眼镜其实更应该满足我们的陪伴属性。不过基于笔者对于AR眼镜类产品的体验发现,AI在响应用户需求的时候仍略显呆板,这是由多方面原因所导致的。

一方面如果我们想要AI更了解我们,那么就需要它对于我们的生活参与更多,如相机、麦克风实时处于响应状态等,这对于设备续航是一个极大的考验。当然,这背后也涉及到隐私问题。

另一方面,目前AI大模型的“记忆能力”仍是一个稀缺属性,它们只能机械式记录特定token数的上下文信息,因而用户与之互动过程中会明显感觉到一种“隔阂”,难以产生体验黏性。(如果能实现这一点,现如今林林总总的年度报告简直不值一提。)

好消息是,关于超强记忆AI似乎很快迎来重要突破,微软AI CEO Mustafa Suleyman早些时候接受采访时曾提到,微软正在开发具有“近乎无限”内存功能的技术。这项进步预计将于2025年实现,它将使AI能够无限期地保留信息,从而改变用户参与度。

无独有偶,近日OpenAI CEO Sam Altman公布了公司的新目标,“更好的记忆力,更长的上下文”赫然在列。

图源:X

功能落地方面,去年年末Meta以及谷歌均展示了带短暂记忆能力的AI功能体验,如Ray-Ban Meta可以帮你记住停车位置、搭载Android XR的眼镜可以帮你记住大门的密码锁等。谷歌近期所更新的AI助手Project Astra也以“记忆”作为重要功能之一,据悉可以记住过去互动的背景信息。

Project Astra,图源:Deepmind

 AI+VR:处理器性能飙升带来的AI功能拓展 

虽说“AI+眼镜”是最具想象力的场景,不过对于MR产品而言,AI相关用例也明显提升。

背后原因可能有两点,一是AI已经成为一种重要营销手段,二是去年的拳头产品,如PICO 4 Ultra、Quest 3S以及Project Moohan等,处理器升级为了骁龙XR2 Gen 2/+处理器,它具备更强的AI算力。以下是部分头显产品曾展示的一些AI功能体验:

Quest 3/3S:今年7月,Meta为头显上线了Meta AI,可以通过双击手柄的Meta按钮唤醒。对于支持全彩VST的设备,设备可以实现视觉搜索功能,如询问花园的植物品种等。

PICO 4 Ultra:内置了AI生成桌面背景、AI 2D抖音短视频转3D等玩法。

Project Moohan:配备了与AI深度融合的Android XR系统,它在玩法方面相比前两者更胜一筹,如可以实现系统级响应,实时在线,并支持语音交互以及视觉搜索等。

笔者认为如果在轻度办公场景下,Project Moohan由于得益于大屏+AI属性,它的生产力并不一定会弱于目前的PC设备。当然后续更多功能还有待进一步观望。

画圈搜索功能展示,图源:谷歌

 写在最后:新一年将继续喧嚣 

2025年,无疑是“AI+XR”赛道更为热闹的一年,对于AI眼镜,前面提到字节跳动、小米等巨头将会进场、Ray-Ban Meta会推出带屏迭代款;对于AR眼镜,预计三星、谷歌等厂商会有新品发布;对于MR头显,有传言称VIVO将会在这一年入局。

随着这些新企业的入局,“AI+XR”新品在价格、功能场景以及品牌影响力等方面都会给市场带来“巨头震撼”,市场会经历一次大浪淘沙。

在笔者看来,今年有两个值得持续关注的地方,首先谷歌在去年年末发布了XR操作系统Android XR,预计今年会有不少品牌“上车”。它的出现,有利于降低XR行业的准入门槛。

此外,笔者认为眼镜并非“AI载体”的唯一解,新的一年中可能会出现更多全新的终端形态。

新的一年,让我们携手前进。

       原文标题 : 【年度专题】XR终端,能否吃到AI落地的最佳红利?

声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

    人工智能 猎头职位 更多
    扫码关注公众号
    OFweek人工智能网
    获取更多精彩内容
    文章纠错
    x
    *文字标题:
    *纠错内容:
    联系邮箱:
    *验 证 码:

    粤公网安备 44030502002758号