创头条App
扫码下载APP
扫码下载APP

您是个人用户,您可以认领企业号

    免密码登录
  • 图形验证码
  • 获取验证码
  • 立即登录
第三方账号登录
·
·

Hello,新朋友

在发表评论的时候你至少需要一个响亮的昵称

GO
资讯 > 干货 > 刘国清:无人驾驶中基于视觉的目标识别技术
分享到

刘国清:无人驾驶中基于视觉的目标识别技术

时间:04-17 08:05 阅读:23097次 转载来源:Xtecher

摘要:作者:欣彤Iris(本文整理自Minieye创始人及CEO刘国清于4月12日在Xtecher深圳私享会上的分享发言)很高兴有机会参加本次私享会活动,并和大家一起分享、交流。今天我给大家分享的报告主题是无人驾驶中基于视觉的目标识别技术。除了我们业内比较高调的如谷歌、百度等公司,还有一些公司在无人驾驶领域有着清晰的布局。既有像谷歌这种直接从level0做到level4的公司,还有像通用采取的一些稳健的模式,从level0、1逐步

(本文整理自Minieye创始人及CEO刘国清于4月12日在Xtecher深圳私享会上的分享发言)


很高兴有机会参加本次私享会活动,并和大家一起分享、交流。今天我给大家分享的报告主题是无人驾驶中基于视觉的目标识别技术。


除了我们业内比较高调的谷歌、百度公司,还有一些公司在无人驾驶领域清晰的布局。既有像谷歌这种直接从level 0level 4的公司,还有像通用采取的一些稳健的模式,从level 0、1逐步过渡到level 4,无论哪种模式,它们视觉感知这一块大家都高度一致采用多传感器融合的方式。   


包括我们今天主要聊的Camera LidarRadar以及多种传感器融合的感知系统。高的无人驾驶,出于对安全性和可靠性的要求,需要多种传感器融合到一起,通过信息的冗余来提升安全性可靠性。


今天我想和大家分享的观点是视觉感知是不可或缺的。它包括几方面原因:,首先,从分辨率的角度来看,现在主流的Camera超过Lidar、Radar,Lidar和Radar最多能够达到0.3兆,Camera的高分辨率带来更大信息体量,它的意义就在于,用户能够更好地了解驾车环境,在越是复杂的交通环境和城市环境,这些细节越变得重要。


另外一个角度是它拥有信息体量优势,在信息的维度上有一定优势,可以帮助我们能够更好地去对交通环境有一个定性的认识。


对于这个图片里面显示的交通状况,它是高速且比较干净,在这种较简单的情况下,有可能可以达到无人驾驶的感知要求。但是若进入到更富有挑战性的环境,则需要更丰富的传感器去获取更多的信息。


视觉感知在无人驾驶这个技术方案里具有不可替代的作用。令我们感到幸运的是,这样一个细分领域,已经经历了50年的发展。


PPT上这位老先生Marvin Minsky他是视觉感知这块的开山鼻祖,也是图灵奖得主。他在1966年的时候,给他的几个博士生和本科生出了一个研究课题,他希望利用当时的计算机,把计算机和摄影机连接起来并开发一套软件。这套软件能自动地让计算机去描述摄影机拍摄到的画面。Marvin Minsky由此拉开了无人视觉感知技术演进的序幕经过了五十年的发展,现在我们的技术可以应用在不同的细分领域,包括人脸识别,人脸检测相关技术。


webwxgetmsgimg (2).jpg

 

回顾这五十年技术的发展,两个趋势跟大家分享一下,首先这个趋势是感知技术里面建模的过程中,机器学习发挥了越来越重要的作用。我以人脸检测为例给大家简要介绍一下,1990年以前,我们做人脸检测的时候,我给你一张图片,你把这个图片里面的人脸框出来,这样一个任务现在看是采用很原始的一种方式做的,那对人脸的建模是基于观察,基于经验,比如我们知道人是有两个眼睛,一个鼻子一张嘴,并且它们还有一些结构上的信息,基于这些信息,基于这些规则来去实现对人脸的建模。这种建模方式很简陋粗暴,但它具有很好的物理含义,容易理解。它的问题就在于适应性欠佳若人的姿势、光照有改变,又或者遮挡了部分五官,则会直接影响检测结果


在1990年至2010年的这个阶段,我认为视觉感知最大的发展,是把机器学习引入到这个领域里,在这个阶段,我们对人脸的建模,还是以人脸为例,而对模型的建立,不再是以前那么简单粗暴。而现在我们先会去定义一些feature,它们是描述一张人脸的基本元素。


webwxgetmsgimg.jpg


webwxgetmsgimg (1).jpg


人脸识别1.jpg


接下来,我们会通过一种学习的方式,在这一万个feature里,挑选最有效表征人脸的特征,然后利用这挑选出来的100个feature,从数学的角度实现人脸模型的建立。这个学习过程,依赖于你如何从数据里学。通常我们会收集不同的人,不同的角度,以及不同的表情各种数据,想做到一个比较好的face detection则需要覆盖各种各样的情况。基于几十万的数据量,我们在挑选了之后,通过数学的方式,把这些特征组合成一个人脸的模型。这个过程,相对于90年代之前,它最大的优势就在于它更科学 原因从大量的数据里学习来实现的,因而具有更广的适应性。


虽然这种方式,相对早期是取得了很大的进步,但它仍然具有一定局限局限性在于,如果训练数据是从万个人里面挑的,但这一万个特征全部都不太好,那学习的结果肯定不理想 另外,特征的设计需要大量经验的积累,因此对功力的考验很大。


到了2010年以后,深度学习开始进入到蓬勃发展的阶段。深度学习相对于传统的感知算法,我认为最大的一个优势在于深度学习把特征设计过程融入到它的学习里。举个例子,我现在要做一个detectotr,一个识别羊驼的模型。以前我可能就要去看很多羊驼的照片,然后设计羊驼的特征。但现在我只需要收集几万张羊驼的图象,把它框出来,然后扔到端到端的深度学习神经网络里,整个特征吸取的过程便能自动完成。


所以,从这三个阶段看出,learning技术在视觉感知建模过程中发挥越来越重要的作用。从最开始我基本上完全没有learning,第二个阶段部分地使用learning,到现在更大规模的特征定义,以及到最终模型的建立,全部基于learning完成。这是第一个趋势。


第二个趋势是视觉感知识别的内容变得越来越精细。如果有兴趣不仿查阅相关论文,你会发现2010年之前的论文做的论题大部分Image classification,也就是说我给你张图片,你识别出图中是否有人,但人的具体位置无法识别出来


下一个阶段,我不仅能够知道图中有车,还能知道车的具体位置。这个更深层次的更细腻的一个任务,被称为Bounding-box detection


现在大家感兴趣的深度学习叫Pixel labeling,不仅能获取目标的具体位置,还能够知道这个图象里具体像素所对应的目标。


从应用角度来看,在ADAS阶段,在相对低level的无人驾驶阶段,Bounding-box detection可以很好地满足需求。


但是随着汽车无人驾驶环境推进,我们需要对环境感知越来越精细。因为跟我们人身安全密切相关,感知得越精细安全性则越好。在这种情况下,Pixel labeling发展趋势。


视觉感知技术,实际上是一种通用的技术,它可以应用在不同领域。我们今天主要聊的是在车载这个环境里,相对于其它的应用环境,比如安防、考勤、娱乐等,车载环境实际上需要面临更多的挑战。这个挑战是由几个冲突造成的,第一个冲突来自准确性和类别内差之间的冲突。准确性关于人身安全,所以我们对准确性的要求非常高。类别内差过大是由很多原因造成,比如姿态。而我们要识别交通环境里各种姿势的行人,如正面、侧着身弯腰捡东西等。也包括光照、天气变化等原因,因此造成准确性与类别内差之间的冲突。


第二个矛盾来自于实时性和计算资源。实时性是指即时地识别反应。而视觉感知技术,它本身就是很占计算资源。而车载的硬件,它相对于消费级的,最大的特点是可靠。它的强项不在于计算能力。


在计算资源有限的平台上,要做很复杂的识别障碍的操作,并且又保证行车记录,所以这也是一个很大的挑战。


那如果去评价一个视觉感知系统,尤其是在车载环境里概括起来是三个方面准确性、实时性和计算资源


关于准确性,我想强调一点,准确性由两方面构成的,一是识别率,另一个指标误检率或误识率。


另外一点,则是实时性,实时性不同的应用领域有着不同的要求。无人驾驶对实时性的要求最高。如果我们想用识别核心应用,一定要先了解我们这个应用能够去接受的实时性要求是什么,然后再去选平台以及算法。


第三个方面是数据库。举个例子,我现在有两个系统,一个系统在一个有1000个样本的测试数据库里得到了100分。另外一个,在一个有1000万个的测试样本库里面得了98分,到底是98分还是100分好?这个不能直接判定100分的好。因为我100分是在只有1000张测试样本中获得它覆盖的测试状况,可能只覆盖了一个城市或者一种交通环境。但是另一个取得98分的系统,可能覆盖到了整个全国各种交通环境从高速到省道到县道乡村道路,从夜晚到白天。所以我们要在关注技术失调同时,也要了解技术指标是在什么样的条件下得到的,是在什么样的数据库下检测。从这三个角度考虑,能够帮助我们大致地判别技术的好坏


最后再分享一下我们团队专注的事情。我们不仅要做算法硬件,还要做品牌运营,这对一家创业公司来讲,可以说具有毁灭性的。因为无论是算法还是硬件的完成,都十分困难。但是对于我们做的应用来讲,不能把算法和硬件孤立开如果要让应用真正解决实际问题,那一定要对硬件和软件进行同步的考量。今天就跟大家分享到这里。谢谢!

声明:该文章版权归原作者所有,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系。

评论

未登录的游客
游客

    为您推荐
  • 推荐
  • 人物
  • 专题
  • 干货
  • 地方
  • 行业
+加载更多资讯

阅读下一篇

PerceptIn联合创始人刘少山:为什么三五年内搞不定无人驾驶

PerceptIn联合创始人刘少山:为什么三五年内搞不定无人驾驶

返回创头条首页

©2015 创头条版权所有ICP许可证书京ICP备15013664号RSS