百度打造国内首个可交互超写实明星数字人,背后技术会有多深?
日前,百度APP正式上线了以明星龚俊为原型的数字人语音搜索助理。据介绍,这是国内首个可以在在APP端实现用户互动的超写实数字人。用户进入该功能界面后,可以与“龚俊”实时交互,如询问天气等问题,“龚俊”将快速识别、搜索,并语音播报首条搜索结果。此外,用户也可以命令“龚俊”完成APP内的部分控制功能,如打开夜间模式、进入书架页面等。
据媒体报道称,该数字人在模型上,百度使用4D扫描技术捕捉龚俊真人的说话以及日常表情的面部细微变化,以实现对其本人的超写实还原。而在语音识别上,百度赋予了其超高准确率的语音识别技术,准确率达到98%,并且对于中英文混杂、生僻字、方言等各种语音也能准确识别。另外,在语音合成上,该数字人依托于TTS(Text To Speech)技术,可以无限接近于原声。
从专利角度看,根据智慧芽数据显示,百度及其关联公司在全球126个国家/地区中,共有1700余件与“语音识别”相关的专利申请。其中,有效专利840余件,授权发明专利730余件。通过对上述全部专利进行分析可知,百度在语音识别技术领域的专利布局,主要聚焦于
语音交互、语音信息、人工智能、语音信号、语音合成、语音控制等相关的技术领域。
目前,虚拟偶像市场火热,众多企业、机构纷纷发布自己的虚拟偶像,如DOTA2官方虚拟偶像dodo,清华大学虚拟学生华智冰,湖南卫视虚拟主持人小漾,还有此前就已经在二次元圈内大火的初音未来、洛天依等。
量子位发布的《虚拟数字人深度产业报告》显示,虚拟数字人的应用可分为服务型虚拟人和身份型虚拟人。替代真人服务中的虚拟主播和虚拟IP中的虚拟偶像是目前的市场热点。报告预计,在2030年,我国虚拟数字人整体市场规模将达到2700亿。身份型虚拟数字人约1750亿。服务型虚拟数字人总规模超过950亿。目前市场仍处于前期培育阶段。
(备注:智慧芽全球专利数据库收录数据包括126个国家/地区中已经公开的专利,一般来说,专利从申请到公开可查询,需要4到18个月)
最新活动更多
-
即日-11.13立即报名>>> 【在线会议】多物理场仿真助跑新能源汽车
-
11月20日火热报名中>> 2024 智能家居出海论坛
-
11月28日立即报名>>> 2024工程师系列—工业电子技术在线会议
-
12月19日立即报名>> 【线下会议】OFweek 2024(第九届)物联网产业大会
-
即日-12.26火热报名中>> OFweek2024中国智造CIO在线峰会
-
即日-2025.8.1立即下载>> 《2024智能制造产业高端化、智能化、绿色化发展蓝皮书》
推荐专题
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论