Waymo首席科学家在MIT自动驾驶课上开讲:如何解决自动驾驶的长期挑战
那么我们如何进行大规模的路测呢?
因为特殊罕见的异常情况很少发生,如果使用真实情况进行路测,我们需要等待很长时间,为了解决这个问题,我们自己构建条道路。
因为我们有Google的数据支持所以这个想法是可行的,所以我们按照如下图数据做出仿真模型。仿真出足够多的场景供以测试。而我们为什么要做出如此多的仿真模型呢?因为有时会得出截然相反的结果,所以我们要加强系统的鲁棒性,这就要求我们做出足够多的仿真模型,确保系统的准确性。
这是一种抽样方法。
上图正在模拟真实世界可能会发生的事情。如果想要得到准确的数据,我们需要模仿真实的人类在不同的情形下做出的真实举动。
如何评价这个简单的模型呢?
正面:容易调整关键参数,如反应时间,制动轮廓,横向加速。有效再现避碰场景中的基本人类行为;反面:无法处理更复杂的交互行为。
但是定义它本身是一个复杂的问题,所以我们能做什么呢?那就是从实际演示中学习代理模型。
机器学习仿真的解决办法就是构建另一个机器学习模型。
添加排列可能会出现问题,这是一个众所周知的问题。
我们使用了非常不同的体系结构去避免碰撞,例如RNN模型。
在一条陌生的路上开着车,需要看到更多的范围和预判更多的特殊情况,如掉头需要处理好。
上图是人类行为分布,可以看到这是个正态分布,所以这就是导致了“长尾巴情况”的根本原因。即使图像两端的情况很少发生,我们的测试也要涵盖进去所有的人类行为情况。
需要我们拓宽这个分布,或者仿真出更多的例子。
行为轨迹优化模型:反RL用于找到创建所需轨迹的变量。
许多不同的方法来克服“长尾”问题。
“智能”模型对于自动化是至关重要的。通过模拟更真实人类行为是非常重要的。
因为还存在很多不同的场景,每天都上演着不同的事情,所以“长尾巴情况”还将会在不同的城市,不同的环境中持续下去的。
在一些好的训练步骤如下:对收集的数据进行培训;能够在不确定或不正确的情况下进行量化;能够采取措施,比如向评分者提问;更好的是,通过因果分析直接自我更新。
总结:Waymo 专家举出的有人带着停车标志是一个有趣例子,而且对机器学习的一个非常基本的介绍,其中提到了AutoML模型,可以测试多达10K的不同架构。然后采用前100个架构,在更大的模型上进行测试。Waymo是一个混合系统,使用ML和混合ML(传统的ML编程)。随着ML能力的增长,传统场景越来越少。视频中也提到了waymo 如何测试,结构化测试,是否有封闭的测试环境。在模拟器方面,他们认为代理能够模拟现实世界中发生的事情。不断扩大复杂模型,来处理长尾问题。或者利用专家领域知识,换句话说混合模型或传统编程。以及逆强化学习,值得深入研究。
图片新闻
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论