ECCV 2020 | 基于对抗路径采样的反事实视觉语言导航 - OFweek 人工智能网

当前位置： OFweek 人工智能网 > 自然语言处理 > 正文

ECCV 2020 | 基于对抗路径采样的反事实视觉语言导航

2020-08-06 10:29

为了提升对于未知环境的适应性，预探索也被应用到了整套系统中去。导航器可以首先探索不熟悉的环境，并增加在未知环境中执行导航指令的机会。针对先前的预探索方法，像束搜索和自模仿学习，他们基于指令并对每一条指令进行优化，但这种方法会造成路径过长。在真实环境中部署机器人到陌生环境时，首先要熟悉环境并有效地在环境中执行自然语言指令。

与先前方法优化给定指令或假设一次性覆盖所有未知环境不同，本文提出了利用APS方法来实现基于环境的预探索，可以使得智能体仅仅针对同一环境中的任务进行环境预探索，而无需先验知识。在未知环境中，利用APS来采样多条路径P’并生成导航指令I’。随后利用（P’，I’）来优化位置环境中的NAV。在预探索过程中，固定APS参数而仅仅优化NAV。通过这样的方法可以有效提升模型对于未知环境的适应能力。

未知环境中的预探索优化流程。APS对未知环境进行采样来优化NAV。

二、实验结果

为了验证这种方法的有效性，研究人员在视觉语言导航数据集R2R（Room－to－Room）上进行了实验。实验分别针对Seq2Seq、Speaker－Follower、RCM等三个基准进行，分别为其增加随机采样增强路径、APS采样增强路径观察导航误差（Navigation Error）、成功率（Oracle Success Rate，Success Rate）、路径长度加权的成功率（Success Rate weighted by Path Length），其结果如下表所示：

可以看到基于APS的方法显著地提升了三种基准的性能，下图还更为直观地反映了随机采样和APS增强采样模式针对两种方法在不同增强率下性能提升：

下图还展示了预探索策略对于未知环境导航的有效性，可以看到经过预探索后导航模型可以根据指令径直向前，方向和移动过程更为准确。研究人员还发现在差异较大的环境中，预探索能显示出的能力也就越强，在实际使用中就会具有更强的适应性和泛化性。

如果想要了解更多的实现细节和实验结果分析比较，请参看论文，其中不仅包含了充分的理论分析和模型的详尽实现细节，同时还涵盖了完整的消融性分析结果。

关于我“门”

将门是一家以专注于发掘、加速及投资技术驱动型创业公司的新型创投机构，旗下涵盖将门创新服务、将门技术社群以及将门创投基金。将门成立于2015年底，创始团队由微软创投在中国的创始团队原班人马构建而成，曾为微软优选和深度孵化了126家创新的技术型创业公司。

将门创新服务专注于使创新的技术落地于真正的应用场景，激活和实现全新的商业价值，服务于行业领先企业和技术创新型创业公司。

将门技术社群专注于帮助技术创新型的创业公司提供来自产、学、研、创领域的核心技术专家的技术分享和学习内容，使创新成为持续的核心竞争力。

将门创投基金专注于投资通过技术创新激活商业场景，实现商业价值的初创企业，关注技术领域包括机器智能、物联网、自然人机交互、企业计算。在近四年的时间里，将门创投基金已经投资了包括量化派、码隆科技、禾赛科技、宽拓科技、杉数科技、迪英加科技等数十家具有高成长潜力的技术型创业公司。

<上一页 1 2 3

本地收藏打印推荐给朋友

声明： 本文由入驻维科号的作者撰写，观点仅代表作者本人，不代表OFweek立场。如有侵权或其他问题，请联系举报。

发表评论

共0条评论，0人参与

登录登录即可访问所有OFweek服务

用户名/邮箱/手机：
密码：
忘记密码？
用其他账号登录： QQ | 微信 | 新浪微博

请输入评论内容...

请输入评论/评论长度6~500个字

暂无评论

暂无评论

图片新闻

最新活动更多

一周热点月点击榜

企业服务广告服务猎头服务薪酬报告

人工智能猎头职位更多

扫码关注公众号
OFweek人工智能网
获取更多精彩内容

文章纠错

x

_*文字标题：

_*纠错内容：

联系邮箱：

_*验证码：

看不清，点击换一张

粤公网安备 44030502002758号