【導讀】iPhone X的全面屏設計,蘋(píng)果在該手機上取消了實(shí)體Home鍵,并且用Face ID人臉識別取代了以往Touch ID指紋識別。據稱(chēng)此方法比 TouchID 更安全,誤差率低至 1:1,000,000。

什么是Face ID?
蘋(píng)果公司在iPhone X中使用了“TrueDepth攝像機系統”(也就是“齊劉海”部分),通過(guò)使用里面的傳感器和點(diǎn)陣投影儀,投射出3萬(wàn)多個(gè)點(diǎn),就能形成一張完整的3D“臉譜”用來(lái)識別用戶(hù)臉部。據悉, iPhone X采用定制的芯片來(lái)處理人工智能工作負載,這是一個(gè)雙核的“ A11生物神經(jīng)網(wǎng)絡(luò )引擎”芯片,每秒運算次數最高可達6000億次,該芯片賦能的最重要的事情就是使Face ID身份認證功能能夠快速識別人臉。同時(shí),經(jīng)過(guò)不斷被訓練的神經(jīng)網(wǎng)絡(luò )建模識別人臉,當你的iPhone X識別你的臉部次數越多,它就會(huì )對你越熟悉。不管你是換發(fā)型、留胡子、戴帽子、戴眼鏡,還是光線(xiàn)強弱不同,它都會(huì )認出你。
同為生物識別技術(shù),TouchID的解鎖錯誤率是五萬(wàn)分之一,而FaceID則是一百萬(wàn)分之一,

iPhoneX人臉識別功能主要靠劉海部位的原深感攝像頭實(shí)現,主要包括距離感應器、泛光感應元件、點(diǎn)陣投影儀和紅外鏡頭。雖然iPhone X實(shí)際進(jìn)行人臉識別的過(guò)程非常復雜,不過(guò)可以簡(jiǎn)化成以下幾個(gè)步驟:
1、檢測物體靠近:當各位拿起手機時(shí),首先工作的是距離感應器,它將會(huì )告訴iPhone X是否有物體進(jìn)行靠近;
2、檢測用戶(hù)臉部:泛光感應元件采用垂直腔面發(fā)射激光器(VCSEL),POPPUR只要大家知道它會(huì )發(fā)射低功率紅外光就可以了。在距離感應器檢測到物體后,泛光感應元件就會(huì )對前方物體進(jìn)行掃描,由紅外鏡頭接收信息,并傳給A11芯片神經(jīng)網(wǎng)絡(luò )系統進(jìn)行判斷,識別為臉部后再進(jìn)行下一步操作。
3、獲取3D人臉信息:雖然檢測到是人臉,但是泛光感應元件發(fā)出的只是簡(jiǎn)單紅外光,并不能記錄空間信息,這時(shí)候點(diǎn)陣投影器發(fā)射的高功率紅外結構光就派上用場(chǎng)了。結構光一般指呈條紋狀或者點(diǎn)陣狀的特殊光線(xiàn),這種光線(xiàn)在打到凹凸不平的物體表面時(shí)會(huì )造成圖像扭曲,從而獲得物體的空間深度信息。
4、結構光接收:用于人臉識別的光線(xiàn)對精度要求比較高,不僅點(diǎn)陣投影儀發(fā)射的點(diǎn)要足夠多(三萬(wàn)多個(gè)),同時(shí)還要防止環(huán)境光干擾,因此紅外鏡頭上還搭載濾光片,除了特定頻率的紅外光都會(huì )被剔除掉(為了保證感應能力和避免太陽(yáng)光的干擾,一般選擇800~900nm波長(cháng)附近的近紅外光)。
5、收集完結構光等信息后,手機通過(guò)3D圖像處理芯片可以生成具備空間信息的三維圖像。這些信息將會(huì )經(jīng)過(guò)特殊調制,以數據形式與保存在處理器的Secure Enclave的Face ID編碼(注冊Face ID時(shí)錄入的信息,無(wú)法被提取到手機外或者被傳到云端)進(jìn)行配對,匹配度滿(mǎn)足蘋(píng)果設置的要求后手機就能實(shí)現解鎖。
事實(shí)上,近幾年來(lái)以來(lái),業(yè)界對于臉部識別的應用“屢試不爽”,但一直因為安全問(wèn)題被詬病。比如只需要通過(guò)一張電腦所有者的照片,就可以輕松進(jìn)入設置了臉部識別登錄方式的電腦;再比如流行科學(xué)作家丹·莫倫(Dan Moren)通過(guò)一個(gè)視頻就擊敗了阿里巴巴的面部識別系統。
蘋(píng)果的FaceID,采用的是結構光雙攝方案,通過(guò)將3萬(wàn)多個(gè)光點(diǎn)的網(wǎng)絡(luò )投射到人臉上,并隨著(zhù)用戶(hù)轉動(dòng)頭部以映射臉部3D形狀,最終形成的是一個(gè)三維圖像,這也是目前安全性最高的人臉識別方案。而其它技術(shù)更多還是二維人臉解鎖的方案。
Face ID安全嗎?
蘋(píng)果iPhone X的面部識別功能中包含“注意力檢測”功能,這個(gè)功能可以確認你是在清醒的狀態(tài)下使用手機。因此當你睡覺(jué)時(shí),有人試圖解鎖你手機的行為將會(huì )失敗。
“注意力檢測”原理為人眼視線(xiàn)檢測,檢測用戶(hù)視線(xiàn)方向,判斷用戶(hù)的注視區域,系眼球追蹤技術(shù)的一部分。這部分功能同樣是由“齊劉海”硬件實(shí)現(蘋(píng)果收購的眼動(dòng)追蹤企業(yè)SMI為技術(shù)提供方),利用紅外鏡頭和泛光感應元件,實(shí)現人眼瞳孔的特征定位,在通過(guò)AI芯片A11的深度學(xué)習估算人眼視線(xiàn)方向。
在操作應用上其中涉及的公開(kāi)專(zhuān)利原理摘要為,一種方法包括接收計算機化系統的用戶(hù)的身體至少一部分的三維(3D)映射序列,并從3D映射中提取用戶(hù)頭部的3D坐標 ?;陬^部的3D坐標,識別由用戶(hù)執行的注視方向以及在耦合到計算機化系統的顯示器上,在注視方向上呈現的交互項目。從3D映射中提取指示;指示用戶(hù)正在特定方向上移動(dòng)身體的肢體,并且響應于該指示,將所識別的交互項目重新定位在顯示器上。

這項于2016年12月份公開(kāi)的專(zhuān)利,即是注意力檢查的原理,將上圖的PC機及攝像設備想象縮小到手機端,用戶(hù)只有在眼睛注意力集中在一個(gè)圓圈中,同時(shí)它會(huì )要求用戶(hù)將頭部放在同一個(gè)圓圈中。這一步驟同時(shí)完成人臉圖像掃描,以及注視點(diǎn)映射。
當今視線(xiàn)檢測技術(shù)的精度可以達到1°以下,一些多年從事眼動(dòng)分析的技術(shù)公司可以做到0.4°的高精度。按照1°的偏差精度來(lái)計算,當用戶(hù)注視iPhone X手機屏幕圓圈時(shí),視線(xiàn)偏差距離不超過(guò)5mm。因此,通過(guò)“注意力檢測”技術(shù),當人眼的關(guān)注視線(xiàn)落在手機屏幕上時(shí),Face ID認為此時(shí)用戶(hù)傳達了交互的目的,即進(jìn)行解鎖。而在用戶(hù)視線(xiàn)偏離手機屏幕時(shí),“注意力檢測”結果將幫助Face ID不要誤解鎖手機。

Face ID會(huì )失效嗎?
Face ID為滿(mǎn)足不同時(shí)段不同環(huán)境對攝像頭的要求,如白天、黑夜、室內、室外。攝像頭會(huì )使用紅外光(泛光感應元件)照亮你的臉,使用紅外鏡頭捕捉圖像。以下是人臉識別的具體步驟:
1、首先,把IR圖像從相機發(fā)送到iPhone X的神經(jīng)引擎里,以構建用戶(hù)的人臉3D模型
2、將用戶(hù)的3D模型或“驗證圖像”在計算機算法中呈現,并將其與用戶(hù)存儲的模板或“設置圖像”進(jìn)行比較;
3、根據這兩個(gè)圖像之間的相似度得出對比數值,看驗證圖像和設置圖像是否匹配;
4、如果對比數值高于某個(gè)確定數值,iPhone X會(huì )通過(guò)你的身份驗證并解鎖。
因此,Face ID是否會(huì )失效要看蘋(píng)果對于閾值的設定,如果設定較高的閾值,相應失效問(wèn)題就會(huì )小很多。

2D人臉識別技術(shù)與3D人臉識別技術(shù)
對于刷臉消費、刷臉解鎖這些“黑科技”,人們其實(shí)一點(diǎn)都不陌生,但如果要深入其中,普通人也只能說(shuō)出一個(gè)關(guān)鍵詞:人臉識別。而人臉識別技術(shù)實(shí)際上可以區分為2D和3D兩種。
1、2D人臉識別:2D人臉識別是目前最為常見(jiàn)的人臉識別技術(shù)之一,其工作原理是后期人臉識別系統對圖片中的人臉進(jìn)識別,通過(guò)設定數百或數千個(gè)點(diǎn),并記錄點(diǎn)與點(diǎn)之間的函數,該函數即為此人的面部信息。
2、3D人臉識別: 3D人臉識別是采用3D結構光技術(shù),通過(guò)3D結構光內的數萬(wàn)個(gè)光線(xiàn)點(diǎn)對人臉進(jìn)行掃描后,從而提供更為精確的面部信息,而這類(lèi)面部信息并不會(huì )受到口紅、粉底等化妝品的影響。與2D人臉識別相比,3D人臉識別將提供更為精確的面部數據,最終讓數據更加安全可靠。
“普通視覺(jué)傳感設備讓萬(wàn)物看到世界,而3D傳感技術(shù)則讓萬(wàn)物能像人一樣‘看清’世界。”

3D傳感技術(shù)原理
要談3D傳感技術(shù),就必須先弄清楚光學(xué)測量分類(lèi)以及其原理。
光學(xué)測量分為主動(dòng)測距法和被動(dòng)測距法。主動(dòng)測距方法的基本思想是利用特定的、人為控制光源和聲源對物體目標進(jìn)行照射,根據物體表面的反射特性及光學(xué)、聲學(xué)特性來(lái)獲取目標的三維信息。其特點(diǎn)是具有較高的測距精度、抗干擾能力和實(shí)時(shí)性,具有代表性的主動(dòng)測距方法有結構光法、飛行時(shí)間法、和三角測距法。

主動(dòng)測距法
結構光法
根據投影光束形態(tài)的不同,結構光法又可分為光點(diǎn)式結構光法、光條式結構光法和光面式結構光法等。

目前應用中較廣,且在深度測量中具有明顯優(yōu)勢的方法是面結構光測量法。面結構光測量將各種模式的面結構投影到被測物體上,例如將分布較密集的均勻光柵投影到被測物體上面,由于被測物體表面凹凸不平,具有不同的深度,所以表面反射回來(lái)的光柵條紋會(huì )隨著(zhù)表面不同的深度發(fā)生畸變,這個(gè)過(guò)程可以看作是由物體表面的深度信息對光柵的條紋進(jìn)行調制。所以被測物體的表面信息也就被調制在反射回來(lái)的光柵之中。通過(guò)被測物體反射回來(lái)的光柵與參考光柵之間的幾何關(guān)系,分析得到每一個(gè)被測點(diǎn)之間的高度差和深度信息。
結構光的優(yōu)點(diǎn)是計算簡(jiǎn)單,測量精度較高,對于平坦的、無(wú)明顯紋理和形狀變化的表面區域都可進(jìn)行精密的測量。其缺點(diǎn)是對設備和外界光線(xiàn)要求高,造價(jià)昂貴。目前,結構光法主要應用在條件良好的室內。
飛行時(shí)間法(ToF)
飛行時(shí)間(Time of Flight,簡(jiǎn)稱(chēng)ToF)法,又叫做激光雷達(LiDAR)測距法。它將脈沖激光信號投射到物體表面,反射信號沿幾乎相同路徑反向傳至接收器,利用發(fā)射和接收脈沖激光信號的時(shí)間差可實(shí)現被測量表面每個(gè)像素的距離測量。

ToF直接利用光傳播特性,不需要進(jìn)行灰度圖像的獲取與分析,因此距離的獲取不受物體表面性質(zhì)的影響,可快速準確地獲取景物表面完整的三維信息。缺點(diǎn)則是需要較復雜的光電設備,價(jià)格偏貴。
三角測距法
三角測距法又稱(chēng)主動(dòng)三角法,是基于光學(xué)三角原理,根據光源、物體和檢測器三者之間的幾何成像關(guān)系來(lái)確定空間物體各點(diǎn)的三維坐標。在實(shí)際測量過(guò)程中,它常用激光作為光源,用CCD相機作為檢測器。這種方式主要用于工業(yè)勘探、工件表面粗糙度檢測、輪胎檢測、飛機檢測等工業(yè)、航空、軍事領(lǐng)域,在消費電子類(lèi)產(chǎn)品還不曾涉及。

被動(dòng)測距法
被動(dòng)測距技術(shù)不需要人為地設置輻射源,只利用場(chǎng)景在自然光照下的二維圖像來(lái)重建景物的三維信息,具有適應性強、實(shí)現手段靈活、造價(jià)低的優(yōu)點(diǎn)。但是這種方法是用低維信號來(lái)計算高維信號的,所以其使用的算法復雜。被動(dòng)測距按照使用的視覺(jué)傳感器數量可分為單目視覺(jué)、雙目立體視覺(jué)和多目視覺(jué)三大類(lèi)。
單目視覺(jué)
單目視覺(jué)是指僅利用一臺照相機拍攝一張相片來(lái)進(jìn)行測量。因僅需要一臺相機,所以該方法的優(yōu)點(diǎn)是結構簡(jiǎn)單、相機標定容易,同時(shí)還避免了立體視覺(jué)的小視場(chǎng)問(wèn)題和匹配困難問(wèn)題。

單目視覺(jué)方法又可分聚焦法和離焦法兩類(lèi)。聚焦法是指首先使相機相對于被測點(diǎn)處于聚焦位置,然后根據透鏡成像公式求得被測點(diǎn)相對于相機的距離。相機偏離聚焦位置會(huì )帶來(lái)測量誤差,因此尋求精確的聚焦位置是關(guān)鍵所在。而離焦法不要求相機相對于被測點(diǎn)處于聚焦位置,而是根據標定出的離焦模型計算被測點(diǎn)相對于相機的距離,這樣就避免了由于尋求精確的聚焦位置而降低測量效率的問(wèn)題,但離焦模型的準確標定是該方法的主要難點(diǎn)。
雙目立體視覺(jué)
雙目立體視覺(jué)的基本原理是從兩個(gè)視點(diǎn)觀(guān)察同一景物,以獲取在不同視角下的感知圖像,然后通過(guò)三角測量原理計算圖像像素間的位置偏差(視差)來(lái)獲取景物的三維信息。這一過(guò)程與人類(lèi)視覺(jué)感知過(guò)程是類(lèi)似的。

在雙目立體視覺(jué)系統的硬件結構中,通常采用兩個(gè)攝像機作為視覺(jué)信號的采集設備,通過(guò)雙輸入通道圖像采集卡與計算機連接,把攝像機采集到的模擬信號經(jīng)過(guò)采樣、濾波、強化、模數轉換,最終向計算機提供圖像數據。一個(gè)完整的雙目立體視覺(jué)系統通??煞譃閿底謭D像采集、相機標定、圖像預處理與特征提取、圖像校正、立體匹配、三維重建六大部分。
多目立體視覺(jué)
多目立體視覺(jué)系統是對雙目視覺(jué)系統的一種拓展。所謂多目立體視覺(jué)系統,就是采用多個(gè)攝像機設置于多個(gè)視點(diǎn),或者由一個(gè)攝像機從多個(gè)視點(diǎn)觀(guān)測三維景物的視覺(jué)系統。

對多目系統所采集到的景物圖像進(jìn)行感知、識別和理解的技術(shù)被稱(chēng)為多目立體視覺(jué)系統技術(shù)。在雙目立體視覺(jué)中,對于給定的物體距離,視差與基線(xiàn)長(cháng)度成正比,基線(xiàn)越長(cháng),對距離的計算越精確。但是當基線(xiàn)過(guò)長(cháng)時(shí),需要在相對較大的視覺(jué)范圍內進(jìn)行搜索,從而增加計算量。利用多基線(xiàn)立體匹配是消除誤匹配、提高視差測量準確性的有效方法之?;€(xiàn)數目的增加可以通過(guò)增加相機來(lái)實(shí)現。
光電3D影像技術(shù)
根據獲取圖像信息方法的不同,光電3D影像技術(shù)分為有源和無(wú)源兩種技術(shù),無(wú)源技術(shù)主要是接受物體的輻射或者環(huán)境的發(fā)射,有源技術(shù)是通過(guò)投射一束調制的或未調制的光到物體上通過(guò)檢測物體反射的光來(lái)形成3D圖像。
以前大多數技術(shù)研究集中在無(wú)源3D技術(shù)上,利用三角測量原理,通過(guò)兩臺相距一定距離的照相機,左邊照相機產(chǎn)生的圖像表示深度信息,右邊照相機產(chǎn)生差異的二維圖像。關(guān)鍵是產(chǎn)生深度信息的照相機需要分離出深度信息。無(wú)源3D影像技術(shù)需要拍攝的物體具有突出的輪廓特點(diǎn),比如邊緣、角、線(xiàn)等。其優(yōu)點(diǎn)是不需要特殊的硬件條件,并成功使用在好幾個(gè)方面。這種技術(shù)的缺點(diǎn)是需要兩臺或者更多的高質(zhì)量的照相機、圖像處理軟件。圖像質(zhì)量、拍照速度、數據傳輸等都是這種機制能否被廣泛應用的限制因素。

有源3D光電圖像方法是投射一束有規律的空間分布的線(xiàn)狀光到物體上從而產(chǎn)生一個(gè)網(wǎng)狀格的深度。廣泛使用的有源光方法是飛行時(shí)間(time off light)方法,最近幾年,市場(chǎng)上出現的3D照相機都是基于飛行時(shí)間方法,這些3D照相機主要應用于工業(yè)控制,通過(guò)飛行時(shí)間方法檢測相位來(lái)實(shí)現3D影像。一束幾十兆赫茲被調制的近紅外光照射到物體上,物體反射的光進(jìn)入3D照相機,由于立體物體的遠近距離不同,反射光的相位存在一個(gè)延遲,通過(guò)檢測原始光束以及反射光束的相位延遲從而檢測出物體的景深,從而實(shí)現3D圖像。這種3D圖像傳感器的制作由ZMD公司完成,ZMD公司根據3D圖像傳感器需要高速的特點(diǎn)從噪聲和速度進(jìn)行工藝優(yōu)化,響應速度可以到100MHz以上。
3D傳感技術(shù)的應用
其實(shí),除了用于手機的人臉識別,3D傳感技術(shù)已經(jīng)應用到了很多方面,在2018中國互聯(lián)網(wǎng)大會(huì )上,有國人廠(chǎng)家推出的智慧家庭新生態(tài)解決方案,賦予電視3D人臉識別、精準內容推薦、手勢交互等創(chuàng )新功能,顛覆智慧家庭客廳體驗。通過(guò)3D人臉識別技術(shù),電視可在不獲取用戶(hù)隱私的前提下,精準識別出機頂盒前的觀(guān)眾的用戶(hù)畫(huà)像信息,包括性別、年齡、情緒等等。同時(shí),系統根據登錄的用戶(hù)角色信息,通過(guò)綜合統計分析該用戶(hù)角色的行為數據,可為用戶(hù)提供“千人千面”的個(gè)性化EPG界面,精準推薦電視節目、視頻點(diǎn)播、游戲應用等內容。

此外,3D傳感技術(shù)可以賦能各行各業(yè):首先是機器人廠(chǎng)商,尤其是服務(wù)性機器人的眼睛需要3D視覺(jué)技術(shù),去感知周邊的環(huán)境,例如目標距離、障礙物等信息;其次是安防廠(chǎng)商,在傳統的安防攝像頭里面再加裝一個(gè)視覺(jué)傳感器,就可以獲得一個(gè)更加精準的三維立體信息;還有門(mén)禁門(mén)鎖,3D的刷臉識別相比2D的刷臉識別,安全等級和精準性可以提升一級;最后,就手機行業(yè)的發(fā)展趨勢來(lái)說(shuō),3D傳感技術(shù)未來(lái)的應用空間很大,刷臉等生物識別都離不開(kāi)3D傳感技術(shù),此外VR、AR、美顏也可以搭載3D傳感技術(shù)去做一些交互性、娛樂(lè )性的體驗。還有各種各樣的智能硬件,凡是需要采集物體深度信息的相關(guān)功能,都會(huì )用到3D傳感技術(shù)。
推薦閱讀: