跑赢业内大盘，日活逆势大涨的百度翻译有什么魔力？

2020-05-11 17:40

百度翻译日活迎来新一轮逆势增长：2020年Q1日活较上一季度环比增长10％，较去年Q1同比增长40％，这还是在在业内大盘增长整体放缓的前提下。

同时，百度翻译目前可支持语种扩充到200个，翻译方向近4万个，每天来自世界各地的翻译请求字符量超过千亿，相当于2000部大英百科全书，平均每秒钟就要翻译超过1百万字符。

百度翻译日活的增长，我们或可将归结为疫情的推动。

一方面是学生们在家学习、在线学习，有了更多时间通过手机和电脑使用百度翻译（在校学习期间K12学生不能使用手机）；另一方面，疫情背景下，跨过的多语言沟通变得更加重要，跨语言的信息分享变得紧迫，百度翻译正好满足了突然集中爆发的市场需求。

当然，这并不是百度布局翻译方向十年以来能持续保持增长的全部，在翻译之外，百度翻译还藏着更多“秘密”。

好的翻译产品，从来不只是“翻得准确”

在过去很长一段时间内，“准确率”是评判一款翻译产品是否优秀的唯一标准，因而所有的翻译产品都在准确率上“做文章”，从各个维度的“成绩”来说明自己在这方面有多厉害，但事实上，随着越来越多AI技术融入到翻译产品，其体验好坏的评判维度变得多元起来。

首先，在翻译的广度和速度方面，要不断扩充与突破。

前者不应只局限在主流语言的互通上，而应寻求更大范围内的多语言互译，做到真正意义上的“与世界对话”；后者的最高境界是同声传译。

道理大家都懂，但做起来才知道为什么这两项能力不是每家都有，其原因就在于太难了。

翻译广度牵涉到小语种语言的训练资源，全球5000多种语言，有一半的语言使用者不到万人，很大一部分小语种语言的训练数据只有几万条甚至几千条，难以迈过翻译的门槛。

翻译速度牵涉到时间延迟和翻译质量难以平衡的难题，导致很多翻译产品的同声传译体验很难尽人所意。

百度翻译通过模型上的创新，比如在多语言翻译技术上，提出基于多任务学习的翻译模型、多智能体联合学习模型等，使多个语言可以共享模型表示，再经过回译技术进行数据增强，使得1个季度之内，翻译语种扩充了近7倍，目前支持200种语言互译，是全球支持语种数量最多的翻译系统。

在同声传译领域上，百度翻译又相继提出了可控时延的翻译模型、语义单元驱动的上下文感知翻译模型等，在技术获得了突破，不但开放了全球首个面向真实场景的中英文同传数据集，还举办了首届同传评测，促进本领域技术发展。

还有一个值得一说的案例，由前沿科技领域顶级科学家参与的iCANX Talks（全球前沿科技直播）主办方之前尝试了多款翻译产品，对翻译效果都不甚满意，直到近期才更换为百度翻译。

其次，翻译产品的使用场景不应只局限在原始的文本或语音输入场景中，还应更加丰富和多元。

在技术不断强化的今天，用户追求的产品体验变得更加全面和多样，如果只有“结果”而没有细节丰满的过程，哪怕有100％的准确率，也因为一个字一个字地输入而产生干涩的使用感受，市场不会买账，用户也不会买单。

百度翻译除了文本和语音这两种常规的输入翻译功能之外，其PC文档翻译功能支持word、pdf、ppt、excel等多种格式，支持中英、中日、中韩互译，一键上传，实现不限字数快速翻译，保留文档样式排版，原文译文对照查看，并支持免费导出，提升文档翻译效率。

视频翻译领域，百度翻译携手人人译视界联合推出了百度视频翻译平台，只需上传视频文件并填写必要信息，即可一站式获取AI和人工视频翻译结果。

除此之外，百度翻译在拍照翻译、实景AR翻译、对话翻译等场景中通过AI技术的融合持续在对体验细节进行改善。

可以预料的是，来源于百度的AI技术基底，百度翻译在帮助用户更好地完成翻译这件事上，未来或将增加更多创新性的技术体验。

最后，要从“语言转换”的狭隘产品认知中跳出。

1 2 3 4 下一页>

声明： 本文由入驻维科号的作者撰写，观点仅代表作者本人，不代表OFweek立场。如有侵权或其他问题，请联系举报。

共0条评论，0人参与

立即登录即可访问所有OFweek服务

忘记密码

其他方式

请输入评论内容...

请输入评论/评论长度6~500个字

暂无评论

图片新闻