百度打造国内首个可交互超写实明星数字人,背后技术会有多深?
日前,百度APP正式上线了以明星龚俊为原型的数字人语音搜索助理。据介绍,这是国内首个可以在在APP端实现用户互动的超写实数字人。用户进入该功能界面后,可以与“龚俊”实时交互,如询问天气等问题,“龚俊”将快速识别、搜索,并语音播报首条搜索结果。此外,用户也可以命令“龚俊”完成APP内的部分控制功能,如打开夜间模式、进入书架页面等。
据媒体报道称,该数字人在模型上,百度使用4D扫描技术捕捉龚俊真人的说话以及日常表情的面部细微变化,以实现对其本人的超写实还原。而在语音识别上,百度赋予了其超高准确率的语音识别技术,准确率达到98%,并且对于中英文混杂、生僻字、方言等各种语音也能准确识别。另外,在语音合成上,该数字人依托于TTS(Text To Speech)技术,可以无限接近于原声。
从专利角度看,根据智慧芽数据显示,百度及其关联公司在全球126个国家/地区中,共有1700余件与“语音识别”相关的专利申请。其中,有效专利840余件,授权发明专利730余件。通过对上述全部专利进行分析可知,百度在语音识别技术领域的专利布局,主要聚焦于
语音交互、语音信息、人工智能、语音信号、语音合成、语音控制等相关的技术领域。
目前,虚拟偶像市场火热,众多企业、机构纷纷发布自己的虚拟偶像,如DOTA2官方虚拟偶像dodo,清华大学虚拟学生华智冰,湖南卫视虚拟主持人小漾,还有此前就已经在二次元圈内大火的初音未来、洛天依等。
量子位发布的《虚拟数字人深度产业报告》显示,虚拟数字人的应用可分为服务型虚拟人和身份型虚拟人。替代真人服务中的虚拟主播和虚拟IP中的虚拟偶像是目前的市场热点。报告预计,在2030年,我国虚拟数字人整体市场规模将达到2700亿。身份型虚拟数字人约1750亿。服务型虚拟数字人总规模超过950亿。目前市场仍处于前期培育阶段。
(备注:智慧芽全球专利数据库收录数据包括126个国家/地区中已经公开的专利,一般来说,专利从申请到公开可查询,需要4到18个月)

最新活动更多
-
3月27日立即报名>> 【工程师系列】汽车电子技术在线大会
-
即日-4.22立即报名>> 【在线会议】汽车腐蚀及防护的多物理场仿真
-
4月23日立即报名>> 【在线会议】研华嵌入式核心优势,以Edge AI驱动机器视觉升级
-
4月25日立即报名>> 【线下论坛】新唐科技2025新品发布会
-
在线会议观看回放>>> AI加速卡中村田的技术创新与趋势探讨
-
即日-5.15立即报名>>> 【在线会议】安森美Hyperlux™ ID系列引领iToF技术革新
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论