详情
手势控制背后的三种感应技术玄机
作者:天雷
时间:2015-11-24 11:26:48
车企与IT企业都在秀各自的手势控制,这些酷炫的技术背后,离不开的是测距设备、芯片和算法。

  车企与IT企业都在秀各自的手势控制,这些酷炫的技术背后,离不开的是测距设备、芯片和算法。

  触摸控制方式正在逐渐取代汽车中控屏上的物理按键。但是,我们也都知道,触控并非是唯一被选择的交互方式。语音、手势甚至包括眼球、意念控制都曾出现在各式各样的概念车上。今儿的主角就是手势控制技术。

  比如说今年召开的CES Asia电子展上,大众就展出了一辆带有手势控制功能的Golf R Touch。当然,大众并不是唯一的参与者。同样是在这届CES上,英特尔展出了3D实感技术,不仅可以捕捉手部动作,还能够实现面部识别、3D扫描建模等。而在随后的谷歌2015年I/O开发者大会上,一款名为Project Soli的可穿戴智能设备芯片也能够实时检测双手和手指上的微小活动,并根据设定执行相应动作。这些看上去就酷炫无比让人手痒痒的技术,是怎么做到的呐?

手势控制背后的三种感应技术玄机

  手势控制,天下三分

  虽然三家公司都是手势识别技术,但是他们三个所采用的具体技术却不尽相同。据透露,大众的Golf R Touch上采用的是ToF技术,英特尔的是结构光技术,而谷歌则使用了毫米波雷达的技术。下面就分别来说道说道。

  ToF的全称为飞行时间(Time of Flight),是一种通过计算光线的传播时间来测量距离的技术。根据距离的不同来判断出不同手指的具体位置,从而判断出具体的手势,再对应到相应的控制命令之上。

  要通过光线传播来测算距离,那么就需要一个能够发射光线的装置和接收光线的感应装置。大众使用了一个3D相机模块来发射脉冲光,再利用内置的感应器接收用户手部反射回的光线。然后,根据二者的时间差,处理芯片就可以构建出手部目前的位置和姿势。

手势控制背后的三种感应技术玄机

  大众手势识别技术中藏在换挡杆后方的ToF摄像头(红点位置)

  通过实时采集这些信息,中控系统就可以调用相应的数据库获得用户正在进行的动作。再根据预先定义的功能,就可以实现不同的操作。由于光的传播速度非常快,基于ToF技术的感光芯片需要飞秒级的快门来测量光飞行时间。这也是ToF技术难以普及的原因之一,这样的感光芯片成本过高。

  结构光技术基本原理与ToF技术类似,所不同之处在于其采用的是具有点、线或者面等模式图案的光。以英特尔公司的集成式前置实感摄像头为例,其包括了红外激光发射器、红外传感器、色彩传感器以及实感图像处理芯片。

手势控制背后的三种感应技术玄机

  英特尔实感技术所用摄像头

  其基本原理为:首先激光发射器将结构光投射至前方的人体表面,再使用红外传感器接收人体反射的结构光图案。然后,处理芯片根据接收图案在摄像机上的位置和形变程度来计算物体人体的空间信息。结合三角测距原理,再进行深度计算,即可进行三维物体的识别。摄像头把采集到的信息发送到负责实感计算的软件开发包(Software Development Kit,SDK)后,该SDK结合加速度计算器,就可以提供手势识别等功能。

  作为一种快速、便携、高精度的三维测量技术,结构光测量技术在航空、模具、医疗等领域均得到了广泛的应用。手势识别只是其中的一个应用案例。

  毫米波雷达的原理同样与ToF技术基本相同,只不过用于测量的介质从光线变成了无线电波。Project Soli利用内置的毫米波发生器把无线电波(雷达波)发射出去,然后利用接收器接收回波。这时,内置的处理芯片会根据收发之间的时间差实时计算目标的位置数据。

  通过比较不同时间段手指位置的不同,Project Soli就可以与内置的数据比较,得到手指正在进行的动作。毫米波雷达的缺点在于信号容易被空气阻挡,扫描范围有限,因而对远距离目标探测不清楚,但对近距离目标勘测十分清晰。在主动安全技术中,毫米波雷达的身影已经不可或缺。另外,在近程高分辨力防空系统、导弹制导系统、目标测量系统等均有应用。

  车载路漫漫

  大众的手势识别技术在体验过程中虽然反应略慢,但是准确率还不错;英特尔的实感技术据称已经研发了三年之久,在游戏上也已经开始实用;谷歌的Project Soli则还只是个展示,尚未正式应用。但是不管是哪一个,车载的路依然很长。大众的工程师表示至少还需要两年的时间才能够把手势识别正式带到量产车型之上,英特尔的实感技术还在与车企接洽,至于谷歌的,就更远了。

  ToF技术在应用时具有明显的缺点——“外部叠加误差”。所谓外部叠加误差,是相对于由于光线散射导致的内部叠加误差而言的。误差产生的原因在于相机发射的光线在到达手部时没有直接返回相机的感光原件,而是通过几次不规则漫反射才回到相机模块。这样测量出来的距离就与实际距离不匹配。然而,如果相机中的背景是固定的,感应器就可以忽略外部叠加误差引起的测量错误。大众Golf正是利用车厢这一固定的背景来减少误差带来的影响。

手势控制背后的三种感应技术玄机

  谷歌Project Soli芯片

  Project Soil采用的是60GHz、波长为5毫米的极高频毫米波无线电波来捕捉动作、距离、速度等信息,感应误差精细到毫米。然而,如何把具有如此精度的设备微小化是一件十分苦难的事情,最难的地方在于微小化会影响器件的发射功率和效率、感应灵敏度等。谷歌用了十个月左右才将其从PC主机大小缩小到了硬币大小,且为了提高精度与排除干扰,用到了两个发射器与四个接收器。目前,Project Soli还没有正式应用到具体设备中。

  至于英特尔的实感技术,从技术本身来说,最需要解决的问题首先是需要验证是否适合用在车内。另外,从现场体验来看,识别的准确度还有待提升。

  除了技术研发上的难题之外,用户在使用时的体验也对开发者提出了挑战。

  与传统操作方式的不同就要求开发团队设计一套新手教程,以此来让用户逐步体感技术的使用方法;用户在使用过程中可能手的一部分会在探测区域之外;在实际的应用中,系统也会需要根据环境进行摄像头的矫正,存在一个学习的过程。这些都是需要开发团队提前想好应对策略。

上一篇:微软推出人脸情绪识别器 下一篇:移动支付规模首超PC端 阿里腾讯争相布局场景化