加入收藏 | 设为首页 | 会员中心 | 我要投稿 应用网_丽江站长网 (http://www.0888zz.com/)- 科技、建站、数据工具、云上网络、机器学习!
当前位置: 首页 > 站长资讯 > 传媒 > 正文

图森互联CTO侯晓迪:用5行代码征服一个领域

发布时间:2016-08-30 19:43:34 所属栏目:传媒 来源:站长之家用户
导读:最近自动驾驶新闻频频,如沃尔沃Uber联手自动驾驶,福特、Uber争相发布无人驾驶商用时间线,comma.ai开源,tesla首例自动驾驶致死车祸......由此我们也能看到自动驾驶的热度

当前的模式识别学术界(以及衍生自学术界的工业界)过度地以“正确率”作为单一的优化目标。一方面大家都知道,算法正确率越高,进一步攀升的难度也就越大;另一方面,却很少有人关注“如果识别错了怎么办”这一问题。通用的做法是错一次就扣一分,不管你是没看到一辆近在眼前的大卡车,还是把路旁的兔子识别成了狗。

在图森,我们一直非常强调的一项技术积累是self-consciousness of AI——即,我们的算法不但需要进行各种识别,还需要对“自己是否识别对了”进行预估。从而进一步提升系统可靠性。

我们申请了一些专利,也有paper发表。

InfoQ:您对最近开源的comma.ai的有何看法?

侯晓迪:comma.ai是典型的深度学习福音派。这种思路一般称作end-to-end learning,认为只要把大量输入(摄像头拍摄画面)输出(油门角度、方向盘力度)数据扔给深度神经网络进行训练,就能教会机器如何驾驶。所有的算法的问题,最终都可以转化为训练数据的问题,并乘着大数据的东风迎刃而解。

这个想法听起来很棒。但实际操作起来却隐患重重。当系统碰到训练集里没有的突发情况时,谁也无法保证会发生什么。其实end-to-end的问题并不是第一天才发现,业界很多人都尝试过,并汇报了类似结果。比如今年GTC 16上,NVidia也介绍了他家的end-to-end driving system,一个最大的特点是,如果一切在预料中,汽车可以很神奇地保持行进路线;但只要稍微偏离,错误变会积累,偏差越来越大。换言之,系统不具备把自己从未知的意料之外的状态中修正回来的能力。

相比来说,我司并不反对deep learning,但是我们坚持认为不能简单粗暴地把deep learning等价于machine learning,因为这种“未知的意料之外”是无论积累多少训练数据都还是会存在的。接着我刚才讲的self-consciousness of AI,我们需要让算法发现自己的错误,并将自我纠错以先验的形式加入到系统中来。想做到这一步,还时需要回过头来借助许多传统的,非deep的machine learning方法。

另外,comma.ai已经公布的代码和数据都很业余,充其量是研究生课程《自动驾驶》的期末课程作业,跟工业级算法系统完全没有可比性(可能也正因此,comma.ai才舍得将其开源吧)。

InfoQ:对于智能驾驶,您觉得是应该以改进算法为主还是以积累驾驶数据训练优化为主?对于在中国,普及实现自动驾驶主要难点有哪些?是否存在“中国特色”?

侯晓迪:改进算法和积累驾驶数据训练优化是一对相辅相成的过程,缺一不可。我认为一个健康的商业模式一定会同时促进这两者。

在中国做自动驾驶,一个难点在于很多公开的学术圈数据集都是国外采集的(德国最多)。另一个难点是由于政策原因导致测绘数据的不完整。这两点会对没人手也没钱的学术工作者和超早期创业团队增加一些麻烦。我也确实见过有几家国内公司,为了给自己强行造壁垒,每次在谈到Mobileye的时候,都拿中国马路上常见的超载大货车说事儿。但说实话,只要Mobileye想把有中国特色的大货车纳入到他们的平台里,从采数据到训练/迁移模型,分分钟就能做好,根本不会有什么战略壁垒。

算法的迁移和泛化相比整套系统,只是非常小的一部分工作量。更何况到了产品层,各家肯定都是自己在准备数据。所以自动驾驶各家比拼到最后,还是得硬碰硬。

(编辑:应用网_丽江站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读