搜狗王小川:无人驾驶如果只做开放OS平台没戏
今天下午,在第五届世界互联网大会上,搜狗发布了全球首个全仿真智能合成主持人。据搜狗CEO王小川介绍,与微软小冰之类的虚拟主持人不同,这个“合成”主播除了声音,还包括唇形及表情。
而在这次大会开幕前两天,搜狗也发布其Q3财报。财报数据显示,其Q3收入2.76亿美元,同比增长7%,但2390万美元的净利润则同比下滑23%。季报称,这部分收入下降的原因在于,智能硬件产品的销售下降,因为搜狗决定升级智能硬件策略,以更好地利用搜狗的人工智能能力并提高产品竞争力。而在这次世界互联网大会的专访中,王小川也对其人工智能布局、财报表现等问题言无不尽。
合成主播是一种“分身”的技术
记者:实际上虚拟主播已经有过很多,搜狗这次跟微软小冰之类的产品有什么不同?它会有什么应用场景?
王小川:我们是一个合成主播,除了声音、还有表情跟唇形,这是一种“分身”的技术,搜狗一直强调从助理、翻译再到分身、问答,一脉相承的技术路线。
作为分身它的使用场景就会有很多。比如我们现在跟凯叔讲故事正在谈合作,以前是他来讲故事,但是如果通过声音表情合成有可能变成爸爸妈妈来讲故事,应用于教育场景。
记者:另一方面,从声音模拟来看,搜狗的主播跟高德地图里的林志玲有什么不同?
王小川:高德地图用林志玲声音做导航,需要录入许多语料,并没有学习过程。而我们需要很少的语料,比如说一个主播只需要录入10分钟的声音就可以将其声音特征模拟到其他的语音内容中,这背后是我们有巨大的数据量支撑,才能实现前端更小的数据样本。
记者:科大讯飞此前提过,翻译的未来是“人机耦合”,语音识别不会取代同传,您怎么看,合成主播是否会取代主播?
王小川:首先AI技术分为感知与认知,在感知方面包括声影图像,机器可以跟人做到基本一样,但认知方面,涉及逻辑性及思考,机器现在做得很有限,这需要分层次看。
合成主播还是需要人的配合。最起码新闻稿需要新华社的编辑去写,它是单向输入这个内容。另外,实际上它是不理解稿子内容的,只是表达视觉与听觉,所以如果跟内容强相关的表情可能做得不够好。
关于财报:智能硬件不需要赚钱
记者:从财报看,医疗广告是目前搜狗广告收入占比最高的部分,但您提到要降低医疗广告收入占比?
王小川:医疗上,我们首先要做到内容权威,其次内容优先于广告,降低医疗广告收入也是为了差异化竞争,如果能让用户喜爱度提高,流量变大,收入也会进一步提升。目前,我们的医疗广告收入占比是低于百度的,我们的用户查询占比超过9%,是百度的两倍,而从收入上看,我们是占比20%,而百度是30%。
记者:从智能硬件上看,作为我们AI一个体现的智能硬件收入却下降。
王小川:明年一季度我们也会做一些大众化的智能硬件产品,但不是音箱,因为音箱的主要竞争优势在于便宜,是资金驱动而不是技术驱动,我们会在生活工作方面做一些新的尝试。
另外,不管大众小众,我们不依赖于智能硬件去赚钱。小众产品,比如翻译宝,我们做品牌;未来的大众产品也是做用户量,依赖于巨大的流量可以去做一些广告之类的其他收入方式。
记者:那我们会做车联网吗?
王小川:这不是我们的优势。单纯的AI是不能谈赚钱的,它只是一种技术,不是商业模式,商业模式只有两种,要么卖服务,向B端卖整套解决方案;要么卖产品,去造车。我们是一家2C公司,又没很大的资金量造车。
记者:那比如说百度apoll这种开放平台模式?
王小川:早期技术创新是来自于一个自我的封闭体系,就像当初PC也是IBM把软件、硬件之类的全做了。开放是一种商业模式创新,是促进一个相对成熟的市场提高效率。从目前看,单纯的一个OS平台是不可能做无人驾驶的,因为没法建立自己的真正核心竞争力。
图片新闻
最新活动更多
-
12月19日立即报名>> 【线下会议】OFweek 2024(第九届)物联网产业大会
-
精彩回顾立即查看>> 【线下论坛】华邦电子与莱迪思联合技术论坛
-
精彩回顾立即查看>> 【线下论坛】华邦电子与恩智浦联合技术论坛
-
精彩回顾立即查看>> 蔡司新能源汽车三电质量解决方案
-
精彩回顾立即查看>> 蔡司新能源汽车三电质量解决方案
-
精彩回顾立即查看>> 2024(第五届)全球数字经济产业大会暨展览会
推荐专题
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论