图片说明
搜狐汽车 > 综合 > 自动驾驶

汽车3D视觉:迎接下一个独角兽

车创 自动驾驶 阅读(0) 评论()

  

  刚刚过去的双十一,相信用上iPhone X付款的亲们已经体验了一种新鲜的付款方式:扫脸支付,看着屏幕就能付款的感觉如此顺畅,不知道有多少人在夜里被媳妇儿刷了脸,神不知鬼不觉……

  就如大家了解的,这种技术实现的方式源于iPhoneX“刘海”的一排“原深感摄像头”,其实用于FaceID以解锁和支付只是原深感摄像头的很小一部分应用,识别手势操作、支持AR令增强现实更加自然等等功能也都不在话下。这项仿佛“黑科技”的技术颠覆了传统摄像头只能拍照摄像的功能,3D视觉技术和深度摄像头也由此变为炙手可热的话题。

  

  到底什么是3D视觉技术和深度摄像呢?下面进入一小段科普时间。

  我们通常接触的普通摄像头大多是二维的,没有深度的,也就是每一个景象都是平面的连续播放。这和我们日常用双眼所看到的三维世界就有所区别了。人类双眼依靠视差来估计深度,3D摄像头在二维图像的基础上增加了对拍摄对象的深度测量(针对待测场景发射一参考光束,藉由计算回光的时间差或相位差,来换算被拍摄景物的距离),即三维的位置及尺寸信息,从而形成三维图像,其“看到”的景象和眼睛所看到的景深是类似的。

  

  3D摄像头呈现的三维路面图像

  有了3D摄像头之后,交互模式也从平面变成了立体,当前科技界炙手可热的领域如人机交互、人脸识别、AR/VR等等,都离不开3D摄像头。

  可喜的是这种技术正在应用与汽车的无人驾驶,而且已经有了应用。

  在汽车辅助驾驶领域,3D视觉技术可以追踪驾驶者的眼皮动作,当检测驾驶员有困倦或注意力不集中式能立即做出响应甚至气动紧急制动系统。配合雷达,还可以提供精准的路面状况信息,避免车祸的发生。

  这项技术从诞生期就受到了科技界的追捧。

  国外布局3D视觉技术的企业大多是原本行业的龙头企业,意法半导体、滨松、欧司朗、艾迈斯、博通等元器件及模组生产厂商,苹果、微软、英特尔、三星、谷歌、索尼等综合系统方案商都纷纷下手。

  比如微软,正是“早起的鸟儿”之一。玩过XBOX的人一定对微软2010年的Kinect1代印象深刻。它让我们可以在家和父母一起对着机器打网球、拳击……也就是现在所说的“人机互动”。后来2012年的Kinect2代、以及去年问世的AR头戴式显示器HoloLense都得益于这项技术。

  

  谷歌则和苹果一样,把这项技术用在了手机上。2016年就借ProjectTango植入联想手机PHAB2Pro,提前在移动端运动追踪、深度感知和区域学习方面实现布局。

  虽说国外布局的企业很多,巨头也很多,但是目前3D视觉技术的赛场上,还没有决出胜负,并无寡头出现,随着技术的发展日新月异,未来究竟谁主沉浮,还真不一定。

  2015年全球机器视觉市场规模为80.8亿美元。预计到2020年全球市场规模将达到125亿美元,2016-2020年全球机器视觉市场将以年复合9.1%的增长率成长。中国机器视觉产业发展速度快,2016-2020年中国制造有望促使机器视觉维持20%的增长率,预计到2020年中国市场规模将达到152亿元。

  国内市场如此巨大,想入局的企业也很多,根据咨询公司的报告,产业链生态圈也正在逐步形成。

  

  和国外不同,国内专注3D视觉技术的初创公司图漾创始人费浙平表示,像微软和Intel这样的公司,目前都在消费市场上发展,比如体感娱乐和三维扫描,而国内的公司,目前阶段的主要目标是面向行业和企业应用。

  很多安全敏感的场所需要能够辨别人物行为,而在目前的视频数据基础上,完全没法做好复杂的分割和识别分析,必需依赖于深度摄像头捕获的三维信息才能实现智能的行为分析。比如自动驾驶场景。

  自动驾驶汽车的从感知到认知,要解决的三个核心问题:车在哪儿?车在路上看到了什么?车要去哪儿?其中,3D机器视觉可以帮助解决就是第二个问题——车在路上看到了什么?

  “我站在这里一动不动,为什么你就能认为我是一个人,而不是一个雕塑?”在这个过程中,对事物的整体三维还原很重要。现在要将这个3D认知模型引入到驾驶任务中。分为几部分:输入(单目、双目、激光雷达等)→似物性检测(ObjectProposal,识别人/车的位置、大小和姿态等)→三维语义预测→输出(类别、位置、大小、姿态)。

  

  这样,自动驾驶汽车所看到的场景就不再是二维的,而是像人的双眼所看到的世界那样,是三维立体的,大大提升了自动驾驶的安全性和可行性。

  除了这些应用场景,家庭扫地机器人、物流包装、工业自动化等等场景都可以用到这项技术,应用场景很广。也正因为此,资本市场也是比较青睐这个行业的。

  2014年1月,做全自主3D传感器的奥比中光科技获得数千万人民币的A轮投资;2014年12月,做智能体感的乐行天下获得1亿人民币的B轮投资,资方为天图资本、华诺创投及五岳资本;2017年5月立体只能视觉企业伟景智能宣布完成5000万人民币A轮融资。

  国内专门针对VR、AR技术的新浚资本的何建文表示,他们比较偏好技术驱动的公司,而且因为下游生态链(代工厂、应用层)逐步完善,上游的技术更有可能变成产品。

  这是一个技术为王的行业,当然,这个行业未臻完美,仍有短板。

  

  实时性就是一个难以解决的重要问题。图像采集速度较低以及图像处理需要较长时间给系统带来明显的时滞,此外视觉信息的引入也明显增大了系统的计算量,例如计算图像雅可比矩阵、估计深度信息等等。图像处理速度是影响视觉系统实时性的主要瓶颈之一。

  还有稳定性也需要考虑。无论是基于位置、基于图像或者混合的视觉伺服方法都面临着如下问题:当初始点远离目标点时,如何保证系统的稳定性,即增大稳定区域和保证全局收敛;为了避免伺服失败,如何保证特征点始终处在视场内。

  不过,随着技术的发展,我们完全有理由相信,这些技术上的障碍可以被克服。2002年起就因电子芯片入行多年的某位业内人士对于三维视觉的发展前景也显得非常乐观。“作为机器和物理世界之间最重要的传感器数据通道,5年后三维视觉传感器的部署数量与二维视觉传感器可能达到1:10的比例。虽然这个数据并没有正式市场报告的支撑,但作为一线的从业者,我自己敢于下这样一个预测。”

  这个时代,让所有过去看起来天马行空的想象都有机会变成现实,借助VR已经可以在现实和虚幻之间来回穿越,有了可以帮机器和设备看到3D世界的这项技术,真正的无人驾驶似乎离我们越来越近了。

auto.sohu.com true 搜狐媒体平台 http://auto.sohu.com/20171116/n522546255.shtml report 4051 刚刚过去的双十一,相信用上iPhoneX付款的亲们已经体验了一种新鲜的付款方式:扫脸支付,看着屏幕就能付款的感觉如此顺畅,不知道有多少人在夜里被媳妇儿刷了脸,神
车图社

车图社

汽车最新实拍图片、官方图片。

娱车有关

娱车有关

与车有关?娱车有关!从汽车科技聊到文化。

汽车咖啡馆

汽车咖啡馆

汽车产业深度报道,权威信息解读。

凹凸榜

凹凸榜

用数据告诉你传播、品牌背后的真相,提供独立、专业的价值标准。

中国交通频道

中国交通频道

广泛的综合性交通多媒体发布平台。

极车制造

极车制造

解读前沿汽车科技,剖析精密造车工艺。