3D 立体影像传感技术 数码相机只能取得平面彩色影像,完全没有深度的资讯,这代表当我们看到一张照片,只知道这个人的脸部有多宽多高,却不知道他脸部的立体结构,例如:鼻子有多挺(有多深),为了取得影像的深度资讯,近年来许多厂商投入研发,目前比较成熟的技术有下列两种: TrueDepth 相机 苹果将 iPhone X 所使用的 3D 立体影像传感技术称为“TrueDepth 相机”,采用结构光方案实现,结构如图 1 所示,TrueDepth 相机为 700 万像素的 CMOS 影像传感器,配合红外光相机、泛光照明器、接近传感器、环境光传感器、点阵投射器等组件,以下简单介绍每个组件的功能: 1. 泛光照明器(Flood illuminator):使用低功率的垂直共振腔面射型激光(Vertical Cavity Surface Emitting Laser,VCSEL),发射出“非结构”(Non-structured)的红外光投射在物体表面。 2. 接近传感器(Proximity sensor):使用低功率的垂直共振腔面射型激光发射红外光激光,当有物体靠近时会反射激光光,因此手机可以知道有物体接近,这个组件很早之前智能手机就有了,一般都是安装在扩音器(Speaker)旁边,当使用者拨电话并且将手机靠近耳朵时,接近传感器侦测到耳朵接近就知道使用者正要讲电话,会自动关闭屏幕节省电力消耗。 3. 环境光传感器(Ambient light sensor):使用光二极体(Photo diode)可以侦测环境光亮度,在明亮的太阳下使用者眼睛瞳孔缩小,因此自动将屏幕调亮让使用者容易观看;在阴暗的室内使用者眼睛瞳孔放大,因此自动将屏幕调暗避免使用者感觉太刺眼。 4. 点阵投射器(Dot projector):使用高功率的垂直共振腔面射型激光发射红外光激光,经由晶圆级光学(Wafer Level Optics,WLO)、绕射光学组件(Diffractive Optical Elements,DOE)等结构,产生大约 3 万个“结构”(Structured)光点投射到使用者的脸部,利用这些光点所形成的阵列反射回红外光相机(Infrared camera),计算出脸部不同位置的距离(深度)。 ▲ 图 1:iPhone X 使用的 3D 立体影像传感技术。(Source:苹果) Face ID 解锁原理与步骤 Face ID 解锁主要分为两个步骤,首先必须辨识接近手机的是否为刻意靠近的脸部,或者只是使用者不小心由手机前面晃过去而已;确认是刻意靠近的脸部之后,才开始进行人脸辨识,从前面的介绍可以发现,启动 Face ID 解锁必须同时开启好几个组件,是有些耗电的,因此必须确认是刻意靠近的脸部之后,才开始进行人脸辨识。 当有脸部或物体靠近时,会先启动接近传感器(Proximity sensor),再由接近传感器发出讯号启动泛光照明器(Flood illuminator),发射出非结构(Non-structured)的红外光投射在物体表面,再由红外光相机(Infrared camera)接收这些反射的影像资讯,传送到手机内的处理器,iPhone X 使用苹果自行开发的 A11 处理器,内建双核心的“神经网络引擎”(Neural Engine,NE),经由人工智能的运算后判断为脸部后,再启动点阵投射器(Dot projector)产生大约 3 万个光点投射到使用者的脸部,利用这些光点所形成的阵列反射回红外光相机(Infrared camera),计算出脸部不同位置的距离(深度),再将这些使用者脸部的深度资讯传送到手机内的处理器内,经由计算比对脸部特征辨识是否为使用者本人。 所有的 3D 立体影像传感技术都面临相同的问题,那就是深度资讯的精确度实际值大约只有 1%,意思是距离 1 米远的物体量测出来的精确度与误差大约是 1 公分的等级;Face ID 解锁时脸部与手机的距离大约 10 公分,因此精确度与误差大约是 1 毫米(mm)的等级,这大概足够进行脸部特征辨识了!此外,点阵投射器使用高功率的垂直共振腔面射型激光发射红外光激光,虽然它的功率并不是真的很高,但是入射到眼睛,个人以为长期使用是否会造成眼球的伤害,是另外一个值得医学界研究探讨的问题。
|