订阅
纠错
加入自媒体

跑赢业内大盘,日活逆势大涨的百度翻译有什么魔力?

2020-05-11 17:40
曾响铃
关注

跑赢业内大盘,日活逆势大涨的百度翻译有什么魔力?

百度翻译日活迎来新一轮逆势增长:2020年Q1日活较上一季度环比增长10%,较去年Q1同比增长40%,这还是在在业内大盘增长整体放缓的前提下。

同时,百度翻译目前可支持语种扩充到200个,翻译方向近4万个,每天来自世界各地的翻译请求字符量超过千亿,相当于2000部大英百科全书,平均每秒钟就要翻译超过1百万字符。

百度翻译日活的增长,我们或可将归结为疫情的推动。

一方面是学生们在家学习、在线学习,有了更多时间通过手机和电脑使用百度翻译(在校学习期间K12学生不能使用手机);另一方面,疫情背景下,跨过的多语言沟通变得更加重要,跨语言的信息分享变得紧迫,百度翻译正好满足了突然集中爆发的市场需求。

当然,这并不是百度布局翻译方向十年以来能持续保持增长的全部,在翻译之外,百度翻译还藏着更多“秘密”。

好的翻译产品,从来不只是“翻得准确”

在过去很长一段时间内,“准确率”是评判一款翻译产品是否优秀的唯一标准,因而所有的翻译产品都在准确率上“做文章”,从各个维度的“成绩”来说明自己在这方面有多厉害,但事实上,随着越来越多AI技术融入到翻译产品,其体验好坏的评判维度变得多元起来。

首先,在翻译的广度和速度方面,要不断扩充与突破。

前者不应只局限在主流语言的互通上,而应寻求更大范围内的多语言互译,做到真正意义上的“与世界对话”;后者的最高境界是同声传译。

道理大家都懂,但做起来才知道为什么这两项能力不是每家都有,其原因就在于太难了。

翻译广度牵涉到小语种语言的训练资源,全球5000多种语言,有一半的语言使用者不到万人,很大一部分小语种语言的训练数据只有几万条甚至几千条,难以迈过翻译的门槛。

翻译速度牵涉到时间延迟和翻译质量难以平衡的难题,导致很多翻译产品的同声传译体验很难尽人所意。

百度翻译通过模型上的创新,比如在多语言翻译技术上,提出基于多任务学习的翻译模型、多智能体联合学习模型等,使多个语言可以共享模型表示,再经过回译技术进行数据增强,使得1个季度之内,翻译语种扩充了近7倍,目前支持200种语言互译,是全球支持语种数量最多的翻译系统。

在同声传译领域上,百度翻译又相继提出了可控时延的翻译模型、语义单元驱动的上下文感知翻译模型等,在技术获得了突破,不但开放了全球首个面向真实场景的中英文同传数据集,还举办了首届同传评测,促进本领域技术发展。

还有一个值得一说的案例,由前沿科技领域顶级科学家参与的iCANX Talks(全球前沿科技直播)主办方之前尝试了多款翻译产品,对翻译效果都不甚满意,直到近期才更换为百度翻译。

其次,翻译产品的使用场景不应只局限在原始的文本或语音输入场景中,还应更加丰富和多元。

在技术不断强化的今天,用户追求的产品体验变得更加全面和多样,如果只有“结果”而没有细节丰满的过程,哪怕有100%的准确率,也因为一个字一个字地输入而产生干涩的使用感受,市场不会买账,用户也不会买单。

百度翻译除了文本和语音这两种常规的输入翻译功能之外,其PC文档翻译功能支持word、pdf、ppt、excel等多种格式,支持中英、中日、中韩互译,一键上传,实现不限字数快速翻译,保留文档样式排版,原文译文对照查看,并支持免费导出,提升文档翻译效率。

视频翻译领域,百度翻译携手人人译视界联合推出了百度视频翻译平台,只需上传视频文件并填写必要信息,即可一站式获取AI和人工视频翻译结果。

除此之外,百度翻译在拍照翻译、实景AR翻译、对话翻译等场景中通过AI技术的融合持续在对体验细节进行改善。

可以预料的是,来源于百度的AI技术基底,百度翻译在帮助用户更好地完成翻译这件事上,未来或将增加更多创新性的技术体验。

最后,要从“语言转换”的狭隘产品认知中跳出。

1  2  3  4  下一页>  
声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

    人工智能 猎头职位 更多
    扫码关注公众号
    OFweek人工智能网
    获取更多精彩内容
    文章纠错
    x
    *文字标题:
    *纠错内容:
    联系邮箱:
    *验 证 码:

    粤公网安备 44030502002758号