深度解析iphone x的结构光原理及结构

zemax666 · 发表于 2018-7-2 18:07

3D 立体影像传感技术

数码相机只能取得平面彩色影像，完全没有深度的资讯，这代表当我们看到一张照片，只知道这个人的脸部有多宽多高，却不知道他脸部的立体结构，例如：鼻子有多挺（有多深），为了取得影像的深度资讯，近年来许多厂商投入研发，目前比较成熟的技术有下列两种：

飞时测距（ToF：Time of Flight）：利用发光二极体（Light Emitting Diode，LED）或激光二极体（Laser Diode，LD）发射出红外光，照射到物体表面反射回来，由于光速（v）已知，可以利用一个红外光影像传感器量测物体不同深度的位置反射回来的时间（t），利用简单的数学公式就可以计算出物体不同位置的距离（深度），如图（a）所示。
结构光（Structured light）：利用激光二极体或数位光源处理器（Digital Light Processor，DLP）打出不同的光线图形，经由物体不同深度的位置反射回来会造成光线图形扭曲，例如：打出直线条纹的光线到手指上，由于手指是立体圆弧形造成反射回来变成圆弧形条纹，进入红外光影像传感器后就可以利用圆弧形条纹反推手指的立体结构，如图（b）所示。

TrueDepth 相机

苹果将 iPhone X 所使用的 3D 立体影像传感技术称为“TrueDepth 相机”，采用结构光方案实现，结构如图 1 所示，TrueDepth 相机为 700 万像素的 CMOS 影像传感器，配合红外光相机、泛光照明器、接近传感器、环境光传感器、点阵投射器等组件，以下简单介绍每个组件的功能：

1. 泛光照明器（Flood illuminator）：使用低功率的垂直共振腔面射型激光（Vertical Cavity Surface Emitting Laser，VCSEL），发射出“非结构”（Non-structured）的红外光投射在物体表面。

2. 接近传感器（Proximity sensor）：使用低功率的垂直共振腔面射型激光发射红外光激光，当有物体靠近时会反射激光光，因此手机可以知道有物体接近，这个组件很早之前智能手机就有了，一般都是安装在扩音器（Speaker）旁边，当使用者拨电话并且将手机靠近耳朵时，接近传感器侦测到耳朵接近就知道使用者正要讲电话，会自动关闭屏幕节省电力消耗。

3. 环境光传感器（Ambient light sensor）：使用光二极体（Photo diode）可以侦测环境光亮度，在明亮的太阳下使用者眼睛瞳孔缩小，因此自动将屏幕调亮让使用者容易观看；在阴暗的室内使用者眼睛瞳孔放大，因此自动将屏幕调暗避免使用者感觉太刺眼。

4. 点阵投射器（Dot projector）：使用高功率的垂直共振腔面射型激光发射红外光激光，经由晶圆级光学（Wafer Level Optics，WLO）、绕射光学组件（Diffractive Optical Elements，DOE）等结构，产生大约 3 万个“结构”（Structured）光点投射到使用者的脸部，利用这些光点所形成的阵列反射回红外光相机（Infrared camera），计算出脸部不同位置的距离（深度）。

▲ 图 1：iPhone X 使用的 3D 立体影像传感技术。（Source：苹果）

Face ID 解锁原理与步骤

Face ID 解锁主要分为两个步骤，首先必须辨识接近手机的是否为刻意靠近的脸部，或者只是使用者不小心由手机前面晃过去而已；确认是刻意靠近的脸部之后，才开始进行人脸辨识，从前面的介绍可以发现，启动 Face ID 解锁必须同时开启好几个组件，是有些耗电的，因此必须确认是刻意靠近的脸部之后，才开始进行人脸辨识。

当有脸部或物体靠近时，会先启动接近传感器（Proximity sensor），再由接近传感器发出讯号启动泛光照明器（Flood illuminator），发射出非结构（Non-structured）的红外光投射在物体表面，再由红外光相机（Infrared camera）接收这些反射的影像资讯，传送到手机内的处理器，iPhone X 使用苹果自行开发的 A11 处理器，内建双核心的“神经网络引擎”（Neural Engine，NE），经由人工智能的运算后判断为脸部后，再启动点阵投射器（Dot projector）产生大约 3 万个光点投射到使用者的脸部，利用这些光点所形成的阵列反射回红外光相机（Infrared camera），计算出脸部不同位置的距离（深度），再将这些使用者脸部的深度资讯传送到手机内的处理器内，经由计算比对脸部特征辨识是否为使用者本人。

所有的 3D 立体影像传感技术都面临相同的问题，那就是深度资讯的精确度实际值大约只有 1%，意思是距离 1 米远的物体量测出来的精确度与误差大约是 1 公分的等级；Face ID 解锁时脸部与手机的距离大约 10 公分，因此精确度与误差大约是 1 毫米（mm）的等级，这大概足够进行脸部特征辨识了！此外，点阵投射器使用高功率的垂直共振腔面射型激光发射红外光激光，虽然它的功率并不是真的很高，但是入射到眼睛，个人以为长期使用是否会造成眼球的伤害，是另外一个值得医学界研究探讨的问题。

chialing · 发表于 2018-7-3 00:23

关于最后一个人眼安全问题，囯际上是有相关标准的，厂商肯定会严格按照标准来的，不然手机没办法上市售卖，所以使用者并不用太担心

小渣渣 · 发表于 2018-7-3 08:41

VCSEL激光我也有做过，它的能量还是有点高的，我以前用八个3W的激光器做实验，用手放在0.5m距离处一定时间，手会感觉到发热
这种人脸识别基本原理很多地方有，楼主有没有有关结构光的资料分享，我找过结构光厂家，但是没找到合适的

zemax666 · 发表于 2018-7-9 10:03

小渣渣发表于 2018-7-3 08:41
VCSEL激光我也有做过，它的能量还是有点高的，我以前用八个3W的激光器做实验，用手放在0.5m距离处一定时间 ...

结构光的工作在摸索中，有什么问题可以提出来一起讨论；关于安全性的问题，激光是由安全等级的，结构光也会经过DOE重新分配能量密度，所以不用担心对人眼的危害

lp198451 · 发表于 2018-8-27 09:02

zemax666 发表于 2018-7-9 10:03
结构光的工作在摸索中，有什么问题可以提出来一起讨论；关于安全性的问题，激光是由安全等级的，结构光也 ...

请教您，“DOE是怎么重新分配光的能量密度”呢？衍射不大懂有点好奇，或者有相关文献推荐下我自己看。谢谢啦

zemax_siom_002 · 发表于 2018-9-21 16:27

小渣渣发表于 2018-7-3 08:41
VCSEL激光我也有做过，它的能量还是有点高的，我以前用八个3W的激光器做实验，用手放在0.5m距离处一定时间 ...

有关人眼安全的问题可以参考下图。实际上人眼对不同波长的灵敏度是不同的，一般认为1550nm以外就相对比较安全了。所以，为了能够增加有效探测距离，目前的激光雷达都往1550nm波段去做了。iphone X 使用的vecsel的准确波长我没有查到 (只是说是近红外)，但猜测应该是 1550 nm。

wlopt · 发表于 2018-10-26 15:46

针对DOE重新分配能量的解释，其实干涉衍射这些光学的基本现象都是重新分配能量的过程，因为他可以产生干涉衍射条纹，而DOE就是人为的产生相位，然后不同相位之间的关系可以产生相干次波叠加，使它能够在特定的距离和单位内产生你想要的强度以及相位分布

		自动登录	找回密码
密码			注册

[光学基础知识&概念] 深度解析iphone x的结构光原理及结构

评分

本帖子中包含更多资源

评分

论坛忠实支持者