干货分享 |  深度剖析:3D TOF大起底

创易栈 2017-09-23 15:37:57

关键字:3D TOF, 机器人AR/VR, 人脸识别自动驾驶智能安防


这段时间以来,最热的话题莫过于iPhone X的Face ID,关于用它刷脸的段子更是满天飞。其实iPhone X 实现3D视觉刷脸是采用了深度机器视觉技术(亦称3D机器视觉)。由于iPhone X的推动,3D视觉市场或许将被彻底的激活。

 

除了iPhone X带动消费市场对3D视觉的需求外,目前机器人、智能安防、AR/VR、无人机、工业视觉等许多热门行业对3D视觉的需求同样越来越突出。如在机器人领域,使用深度视觉进行导航、识别外界的环境、规划路径、实现避障工作等;在AR/VR领域,使用3D视觉进行游戏体感交互等等。

 

根据原理和硬件实现方式的不同,行业内所采用的 3D 机器视觉主要有三种:结构光、TOF、双目立体成像,其中,结构光与TOF方案在技术方面较为成熟。未来哪一类技术将更胜一筹,占领3D视觉制高点?目前还不好定论,因为这三类技术更有优缺点和各自适用的范围。

 

不过据投资机构海通证券研究所预测,2017 年苹果 3D 视觉将从结构光方案开始,未来逐渐加入 TOF 方案。因为苹果公司在 AR 方面野心勃勃,计划将 AR 打造成未来的重要应用领域, 而 TOF 方案更加适合远距离 AR 应用,因此,该机构认为未来苹果将通过加入 TOF 方案实现先进的 AR 体验。

 

那么,3D TOF 到此是什么样的一种技术,它具有什么革新的特点和有价值应用?接下来,本文将来从技术原理到具体应用,逐一的、详细的扒一扒3D TOF这个高深的技术。



TOF 技术详解

一、原理


TOF是Time of flight的简写,直译为飞行时间的意思。所谓飞行时间法3D成像,是通过给目标连续发送光脉冲,然后用传感器接收从物体返回的光,通过探测光脉冲的飞行(往返)时间来得到目标物距离。


深度剖析:3D TOF大起底

图1:3D TOF成像原理


通常,固态激光或者 LED 的发射光源是近红外波段(~850nm),对人眼不可见。图像传感器需要能够响应相同的波段,接收光,将光能量转化为电流。注意,进入传感器的光同时包括了环境光和反射光。距离(深度)信息只存在于反射光中。因此,过多的环境光会降低信噪比(SNR)。为了检测发射光和发射光之间的相位移动,光源是脉冲波或是调制过的连续波, 光源通常是正弦波或方波。方波调制更通用,可以通过数字电路很容易实现。

 

通过集成的光电转换器从反射光中获取脉冲调制,或在反射的第一个检测中启动快速计数 器。快速计数器需要一个快速光检测器,通常是一个单光子雪崩二极管(SPAD)。这种计数 方法需要快速电子脉冲,1 毫米的精度需要的时钟脉冲间隔是 6.6 皮秒。这种级别的精度在室 温下的芯片上是无法获得的。


深度剖析:3D TOF大起底

5.png

 图 2: 两种飞行时间方法:脉冲(上)和连续波(下) 


脉冲方法是比较直观的。在一个比较短的时间内,光源照射时间为(Δt),采用两个异相 窗口,C1和 C2,在相同的时间间隔Δt 内,同时并行对每个像素点的反射能量进行采样。在这些采样时间内,电流持续充电,测量 Q1 和 Q2 用下面公式计算距离:

深度剖析:3D TOF大起底

连续波方法每次测量获取多个样本,每个样本相位差 90 度,共 4 个样本。使用这种技术,发射光和反射光之前的相位角为,φ,距离 d 可以通过下式计算:

深度剖析:3D TOF大起底

接着,待测量像素的亮度(A)和偏移(B),计算为:


深度剖析:3D TOF大起底

在所有的公式中,c 是光速 30 万千米每小时。 第一眼看,相比脉冲波,连续波方法的复杂度看似不合理,但仔细看连续波的公式, 就会发现(Q3 − Q4)和(Q1 − Q2)减少了测量中的偏移常量。还有就是,相位角公式中的商值可减少 距离测量中的增益常量的影响,比如,系统中的放大或衰减,或者反射的强度。


反射亮度(A)和偏移(B)会影响深度测量的精度。深度值方差可以用以下公式估计:

深度剖析:3D TOF大起底

调制常量 cd 描述了飞行时间传感器分离和收集光电信号的好坏程度。反射光强,A,是光 强的函数。偏移,B,是环境光和系统内部偏移的函数。可以从公式 6 得到结论是高幅度,高调 制频率和高调制对比度,可以增加精度;但高偏移会导致相机饱和从而降低精度。

 

高频情况下,由于芯片硅半导体的特性,调制对比度会衰减。这是调制频率的实际上线。具有快速下降沿频率的飞行时间相机精度更高。

 

连续波测量基于相位,每 2π重复一次,意味着距离就会产生锯齿。产生锯齿的距离,称为 模糊距离,damb,用公式 7 表示:

深度剖析:3D TOF大起底



离出现循环,damb 就是最大的观测距离。如果需要增加观测距离,就需要减小调制频 率,根据公式 6,就会减小精度。

 

如果不想妥协,高级飞行时间系统就会采用多频技术增加距离而不减小调制频率。增加一个或多个调制频率混合可以生成多频技术。每个调制频率都有一个不同的模糊距离,但真正的位置是多个频率相交的地方。两个调制频率相交,称为差(分)频(率),通常很低,对应一个较长的模糊距离。双频技术方法如下所示。

深度剖析:3D TOF大起底

 图 3: 用多频技术增加距离 


二、点云

 

飞行时间传感器测量 2 维可寻址的阵列传感器中的每个像素的距离,生成深度图。深度图是3 维点云的集合(每个点称为一个体素)。比如,QVGA 传感器的深度图有 320x240 个 体素。深度图的 2 维表示是一个灰度图,如图 4 易拉罐所示,亮度比较亮,比较近的体素。图4 显示了一组易拉罐深度图。

深度剖析:3D TOF大起底

图 4: 易拉罐深度图


另外,深度图可以通过一系列的点组成的三维空间来渲染,或者点云。3D 点可以连接形成网格,表明影射有材质贴图。如果有同一物体的实时彩色图像生成材质,就可以渲染出逼真 的3D 物体,如图 5 所示。图片中的人可以旋转人像看不同的透视图:

深度剖析:3D TOF大起底

图 5: 从点云生成的人像 


3D TOF 相机特性

利用TOF技术成像的设备被称为TOF相机(或TOF摄像头), TOF相机与普通机器视觉成像过程也有类似之处,都是由光源、光学部件、传感器(TOF芯片)、控制电路以及处理电路等几部单元组成。这种技术跟3D激光传感器原理基本类似,只不过3D激光传感器是逐点扫描,而TOF相机则是同时得到整幅图像的深度信息。

 

与同属于非侵入式三维探测、适用领域非常类似的双目测量系统相比,TOF相机具有根本不同3D成像机理。双目立体测量通过左右立体像对匹配后,再经过三角测量法来进行立体探测,而TOF相机是通过入、反射光探测来获取的目标距离获取。

 

TOF技术采用主动光探测方式,与一般光照需求不一样的是,TOF照射单元的目的不是照明,而是利用入射光信号与反射光信号的变化来进行距离测量,所以,TOF的照射单元都是对光进行高频调制之后再进行发射。

 

与普通相机类似,TOF相机芯片前端需要一个搜集光线的镜头。不过与普通光学镜头不同的是这里需要加一个带通滤光片来保证只有与照明光源波长相同的光才能进入。同时由于光学成像系统具有透视效果,不同距离的场景为各个不同直径的同心球面,而非平行平面,所以在实际使用时,需要后续处理单元对这个误差进行校正。

 

作为TOF的相机的核心,TOF芯片每一个像元对入射光往返相机与物体之间的相位分别进行纪录。该传感器结构与普通图像传感器类似,但比图像传感器更复杂,它包含2个或者更多快门,用来在不同时间采样反射光线。

 

因为这种原因,TOF芯片像素比一般图像传感器像素尺寸要大得多,一般100um左右。照射单元和TOF传感器都需要高速信号控制,这样才能达到高的深度测量精度。比如,照射光与TOF传感器之间同步信号发生10ps的偏移,就相当于1.5mm的位移。而当前的CPU 可到3GHz,相应得时钟周期是300ps,则相应得深度分辨率为45mm。运算单元主要是完成数据校正和计算工作,通过计算入射光与反射光相对相移关系,即可求取距离信息。


TOF相机优缺点分析

TOF相机优点:


1、相对二维图像,可通过距离信息获取物体之间更加丰富的位置关系,即区分前景与后景;


2、深度信息依旧可以完成对目标图像的分割、标记、识别、跟踪等传统应用;


3、经过进一步深化处理,可以完成三维建模等应用;


4、能够快速完成对目标的识别与追踪;


5、主要配件成本相对低廉,包括CCD和普通 LED 等,对今后的普及化生产及使用有利;


6、借助 CMOS 的特性,可获取大量数据及信息,对复杂物体的姿态判断极为有效;


7、无需扫描设备辅助工作。

 

TOF相机缺点:


1、相对于普通数码相机,其造价仍然偏高,影响该产品目前的普及使用率;


2、相机本身仍然受到硬件发展的限制,更新换代速度较快;


3、测量距离较常规测量仪器短,一般不超过 10 米;


4、测量结果受被测物性质的影响;


5、大多数机器的测量结果受外界环境干扰较为明显,尤其是受外界光源干扰;


6、分辨率相对较低,


7、系统误差及随机误差对结果影响明显,需要进行后期数据处理。


TOF应用领域

TOF技术具有丰富的应用场景,在汽车、工业、人脸识别、物流、安抚监控、健康,游戏、娱乐、电影特效、3D打印和机器人等诸多领域都有应用。

 

汽车:TOF传感器可以用于自动驾驶,通过TOF技术对行车环境进行感知,从而获取环境信息以增加安全性,此外TOF还可以用于汽车内的乘客离位检测。


工业领域:TOF传感器可以被用作HMI(人机接口:Human Machine Interface),在高度自动化的工厂中,工人和机器人需要在很近的距离下协同工作,TOF设备可以用于控制各种情形下的安全距离。


人脸识别系统:TOF相机的亮度图像和深度信息可以通过模型连接起来,迅速精准的完成人脸匹配和检测。


物流行业:通过 TOF 相机迅速获得包裹的抛重(即体积),来优化装箱和进行运费评估;


安防和监控:利用景深进行人数统计( Peoplecounting)俗称“数人头”,确定进入某区域的人数;通过对人流或复杂交通系统的人数统计,实现对安防系统的统计分析设计;以及敏感地区的检测对象监视;


机器视觉:工业定位、工业引导和体积预估;替代工位上占用大量空间的、基于红外光进行安全生产控制的设备;


机器人:使用深度视觉进行导航、识别外界的环境、规划路径、实现避障工作等;

  

医疗和生物:足部矫形建模、病人活动/状态监控、手术辅助;


互动娱乐:动作姿势探测、表情识别、娱乐广告;在制作影视特效时,TOF相机可以将深度信息附加在视频图像中,精确确定场景中每个像素的空间位置。通过简单的后期处理,就能将特效道具插入影片的任何位置。

 

此外,无论是固定式还是移动式的,TOF设备都可以作为一个性能优异的输入设备。TOF相机的手势识别能力特别适用于消费电子领域,例如游戏、手持式设备和家庭娱乐,以TOF设备为第一人称游戏提供了直观的接口,完全可以代替远程控制,鼠标和触摸屏。

14.png

图6:TOF 应用多种多样


当然,TOF的应用不一而足,如果你还想更加深入的了解3D TOF技术在机器人导航,手势控制,3D扫描,增强现实等等的应用,请关注创易栈微信公众号,我们将于9月26日进行 “TI机器人核心技术全攻略”直播,带你近距离触及机器人最核心和最火爆的技术——TOF 3D视觉、远场拾音以及精准运动控制。还等啥呢,快点击“报名链接”报名吧。


报名链接:http://www.emakerzone.com/move?id=190


注:本文部分内容来源网络以及泡泡机器人SLAM,转载请注明出处。



热门文章

copyright@2014-2016 emakerzone.com 粤ICP备16121718号-2 公安局备案 粤公网