来,让你的车20分钟学会自动驾驶

来源:大强说事 2018-08-09 16:53:57

众所周知,学习是人类具有的一种独特的智能行为,相当长的时间里,这也是区分人类与机器的一条鸿沟,直到“机器学习”的出现。

机器学习(Machine Learning)是一门多领域交叉的学科,其涉及范围包括概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。这门学科专门研究计算机怎样模拟或实现人类的学习行为,以自主获取新的知识或技能,重新解构和调整已有的知识结构使之不断优化,从而持续改善自身的性能——这一点是人类自我进化过程中非常重要的核心技能。

尽管机器学习的发展进程并不如理论上的顺利,但随着性能的提升和算法的优化,机器学习翻越过平台期之后,正在进入新的快速发展阶段。正因为机器学习是机器向人类技能转化的重要工具,它也无可避免地成为了人工智能的核心功能。机器学习是赋予计算机智能的底层途径,其应用遍及人工智能的各个领域,在自动驾驶领域自然也不会缺席。

在自动驾驶领域,硬件和软件两个维度的发展相互促进同时也相互制约,各自的阶段性特点让自动驾驶的整体发展始终处于一种在摇摆中前行的状态。某一个维度的突破通常都会带动另外一个维度的跃升,但关于到底什么才是技术的突破点的争论声也一直存在。我们习惯了几个传统汽车品牌以及刚入场的科技巨头们在传感器和算法方面循规蹈矩的发展路径,一些敢于突破边界的新声音就显得更加宝贵。

如同我们曾经介绍过的X教授——肖健雄曾经提出的只用一个摄像头就可以解决自动驾驶过程中对于环境的感知和识别问题,推崇机器学习内在能力的还大有人在,这一次,声音来自英国。

专注于人工智能领域的英国初创公司Wayve上个月宣布他们所开发的端到端的机器学习算法,将更加容易地使自动驾驶汽车从设想变成现实。过去十年中,科技巨头和传统汽车品牌投资了数十亿美元用于解决自动驾驶汽车问题,在各自的路径上都有所斩获,但Wayve的意见是,整个业界在机器学习领域的投入和专注都太少了,这才是导致自动驾驶发展缓慢的根本原因之一。

Wayve联合创始人兼首席执行官Amar Shah认为,整个自动驾驶拼图中缺少的是智能算法,而不是传感器,规则和地图。他认为:“人类具有在现实世界中执行复杂任务的超级能力,因为我们的大脑使我们能够快速学习并在具体的经历中完成知识的积累和技能的演进。最理想的状态下,自动驾驶汽车需要更好的大脑,而不是更多的硬件。”

“建立一套可以在道路上安全行驶的自动驾驶系统不应该只依赖硬件。”Wayve联合创始人兼首席技术官Alex Kendall说,“我们打算押宝在加强学习和模仿学习等技术上,我们认为机器学习能够为自动驾驶技术的大面积普及提供技术上的突破。“

Wayve的创立有赖于剑桥大学的世界级团队,而他们提出的以机器学习为主而非以数据依赖为途经的思路正在英国公共道路上进行测试。Wayve发展初期的资本支持主要来自于纽约的Compound,欧洲基金Fly Ventures和伦敦的Firstminute资本。

Wayve的现有团队包括来自剑桥和牛津大学的机器人、计算机视觉和人工智能等领域的顶尖专家,而他们则拥有与这个世界上最前沿的技术创新公司合作的经验,包括NASA、Google、Facebook、Skydio和Microsoft,他们的主要工作范围包括从使用深度学习促进视觉场景理解到不确定环境中的自主决策。

眼见为实,通过下面这段视频,让我们一起了解一下Wayve为什么如此坚定地推崇使用无需大量数据的机器学习来解决自动驾驶过程中的技术问题:

视频加载中...

这段视频中,Wayve明确表示他们将通过这个实验去证明加强学习的算法是可以教会一辆汽车如何自动驾驶的。

这辆通过改造的雷诺小车在行驶中的控制逻辑根据随机的参数进行了初始化。在训练阶段,试验车显然一开始是处于一种随机尝试的状态,一旦算法出现了错误的判断,安全驾驶员将会介入终止它的操作并帮助车辆从正确的动作重新开始,而算法在出现错误并被终止之前的行驶行为将得到嘉奖,这显然是为了让算法能够得到足够的信息去判断自己的行为是否正确。

每一次安全驾驶员对于车辆的重新设置都是对于控制逻辑的一种优化,也是对算法的一种进阶推动,而所有的优化都是在车上完成,并没有单独再进行脱机的计算和优化。

通过视频我们可以看到,经过四个小训练周期之后,Wayve开启了对试验车的第一个评估测试。从结果来看,经过四个小训练周期显然还不足以让系统胜任自动驾驶的任务,第一次评估测试仅仅安全行驶了9.8米。

重复了另外两个小训练周期之后,开始了第二次评估测试,这一次系统算法的表现有所进步,毕竟已经经过了六个训练周期。从表现来看,系统有了一定的纠错能力,但是表现依然不够稳定。这套系统的运行基于一套深度卷积神经网络,它接受的输入信号来自于单目摄像头摄取的图片,而系统的输出则体现为对于方向和速度的控制。第二次评估测试的安全行驶距离达到了53.8米,比之于第一次显然有了极大的提高。

又经过了四轮小训练周期之后,驾驶员开启了第三次评估测试。最终,经过十一轮的训练,这套车载系统掌握了如何在这条车道上自动循迹驾驶并成功地行驶完了整条道路。

为验证实验结果,Wayve在不同的天气条件下重复了多次这个实验,这辆测试车也是第一辆由强化学习方法驾驶的车辆。这个实验某种程度上也证明了强化学习即使在缺乏程序和地图加持的情况下,也可以使车辆学会如何自动驾驶,而Wayve下一步将会推进这项技术尽快规模化以使其能够适应更为复杂的驾驶任务。

点击查看原文

相关链接