ECCV 2020 | 基于对抗路径采样的反事实视觉语言导航
为了提升对于未知环境的适应性,预探索也被应用到了整套系统中去。导航器可以首先探索不熟悉的环境,并增加在未知环境中执行导航指令的机会。针对先前的预探索方法,像束搜索和自模仿学习,他们基于指令并对每一条指令进行优化,但这种方法会造成路径过长。在真实环境中部署机器人到陌生环境时,首先要熟悉环境并有效地在环境中执行自然语言指令。
与先前方法优化给定指令或假设一次性覆盖所有未知环境不同,本文提出了利用APS方法来实现基于环境的预探索,可以使得智能体仅仅针对同一环境中的任务进行环境预探索,而无需先验知识。在未知环境中,利用APS来采样多条路径P’并生成导航指令I’。随后利用(P’,I’)来优化位置环境中的NAV。在预探索过程中,固定APS参数而仅仅优化NAV。通过这样的方法可以有效提升模型对于未知环境的适应能力。
未知环境中的预探索优化流程。APS对未知环境进行采样来优化NAV。
二、实验结果
为了验证这种方法的有效性,研究人员在视觉语言导航数据集R2R(Room-to-Room)上进行了实验。实验分别针对Seq2Seq、Speaker-Follower、RCM等三个基准进行,分别为其增加随机采样增强路径、APS采样增强路径观察导航误差(Navigation Error)、成功率(Oracle Success Rate,Success Rate)、路径长度加权的成功率(Success Rate weighted by Path Length),其结果如下表所示:
可以看到基于APS的方法显著地提升了三种基准的性能,下图还更为直观地反映了随机采样和APS增强采样模式针对两种方法在不同增强率下性能提升:
下图还展示了预探索策略对于未知环境导航的有效性,可以看到经过预探索后导航模型可以根据指令径直向前,方向和移动过程更为准确。研究人员还发现在差异较大的环境中,预探索能显示出的能力也就越强,在实际使用中就会具有更强的适应性和泛化性。
如果想要了解更多的实现细节和实验结果分析比较,请参看论文,其中不仅包含了充分的理论分析和模型的详尽实现细节,同时还涵盖了完整的消融性分析结果。
关于我“门”
将门是一家以专注于发掘、加速及投资技术驱动型创业公司的新型创投机构,旗下涵盖将门创新服务、将门技术社群以及将门创投基金。将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。
将门创新服务专注于使创新的技术落地于真正的应用场景,激活和实现全新的商业价值,服务于行业领先企业和技术创新型创业公司。
将门技术社群专注于帮助技术创新型的创业公司提供来自产、学、研、创领域的核心技术专家的技术分享和学习内容,使创新成为持续的核心竞争力。
将门创投基金专注于投资通过技术创新激活商业场景,实现商业价值的初创企业,关注技术领域包括机器智能、物联网、自然人机交互、企业计算。在近四年的时间里,将门创投基金已经投资了包括量化派、码隆科技、禾赛科技、宽拓科技、杉数科技、迪英加科技等数十家具有高成长潜力的技术型创业公司。
最新活动更多
-
11月28日立即报名>>> 2024工程师系列—工业电子技术在线会议
-
12月19日立即报名>> 【线下会议】OFweek 2024(第九届)物联网产业大会
-
即日-12.26火热报名中>> OFweek2024中国智造CIO在线峰会
-
即日-2025.8.1立即下载>> 《2024智能制造产业高端化、智能化、绿色化发展蓝皮书》
-
精彩回顾立即查看>> 2024 智能家居出海论坛
-
精彩回顾立即查看>> 【在线会议】多物理场仿真助跑新能源汽车
推荐专题
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论