“一張照片就可能騙它開門”,隨著智能門鎖的廣泛普及,最近有關人臉識別的安全性質疑聲音越來越多,守護家庭關口的敏感性,也讓大眾對這種質疑相對其他場景要更加關注。
而事實究竟如何,一個智能門鎖產品背后又透露出人臉識別的哪些現實?
不久前,人民網安徽頻道專門做了一期門鎖產品測評視頻,采用打印高清照片、立體仿真頭部模型對兩款3D人臉識別門鎖樣品分別進行安全攻擊測驗,結果高清照片無一獲得通過,而立體仿真頭部模型則有一款產品錯誤地認證通過。
這側面印證了兩件事:
第一,在經過長時間發展后,當下市面上的智能門鎖產品,或者說大部分的采用3D人臉識別技術方案的門鎖,在抵抗2D圖像迷惑這方面都具備一定的能力,“一張照片騙認證”已經比較難(不是沒有可能)。
第二,當下的智能門鎖產品以及人臉識別技術,“魔”與“道”的較量更多集中到了3D視覺,“翻篇了”。而在這里確實有很多產品和技術不過關,但也有能夠準確識別欺詐和其他風險行為的產品和技術,已經不能一概而論。
這是因為,一個包含了所有信息的3D視角的臉“全世界唯一”,3D視覺采集和重建的數據越精準、越接近這個“全世界唯一”,則人臉識別的認證就應當越安全,但目前3D視覺賽道上有各種技術流派,在讓用戶成為“全世界唯一”、沒有其他欺詐“替代品”這件事上所能達到的程度并不相同。
毫無疑問,誰更能無限迫近“全世界唯一”的安全性目標,誰就能在智能門鎖場景下排除質疑、掌握市場先機,而這其中,3D結構光方案逐漸凸顯出來。
智能門鎖3D視覺技術
多種模式并行,3D結構光凸顯
目前市場上應用到智能門鎖場景下的3D視覺方案主要有三種:
結構光方案,即通過三維感知相機采集人臉的幾何形狀、尺寸和近紅外紋理信息,進行高精度重建、識別,可以近似認為等于用大量細密的“點”立體繪制了一張精細化的臉。
雙目方案,基于視差原理來獲取面部的三維幾何信息,這種方案如要通俗理解,有點類似于普通人在電影院利用左右眼視差看3D電影里獲得了立體感,某種程度上更像是2D技術的一種3D化,不是真正的3D。
TOF方案,即用紅外光(激光脈沖)對外發射后收集反射回來的光線,測算反射時間確定位置和遠近信息,大量數據組合后得到一個立體的3D模型,有點像普通人比較熟悉的超聲波反射定位。
實際上,由于TOF方案面臨傳感器技術不成熟等問題,目前在智能門鎖賽道上出現的主要是前面二者,而結構光似乎更受青睞,人民網的評測視頻中提到拒絕了立體頭部仿真模型欺詐攻擊的門鎖產品其人臉識別技術來自一家創新企業的盧深視,而這家公司同樣主攻的是3D結構光技術。
結構光方案和雙目方案不能說有絕對的優劣之分,各有產品適用,但是,3D結構光方案看起來更適合于門鎖場景。
一方面,雙目方案擁有更低成本優勢但在安全性上不及結構光方案,它在一定安全需求范圍內還是“稱職”的,就像一般人的安保不可能都強求達到總統級別,多大的重要性、多大的預算選擇對應的安全即可——只不過,對守著家門安全的門鎖來說,越來越嚴重的擔憂情緒注定讓“性價比”讓位于更高的安全需求,因此成本更高一些的結構光方案就成了更多廠商的選擇。
另一方面,結構光方案在5米以內的近距離精度更高,但隨距離增加精度會相應下降,但也恰恰是這個“缺點”,讓結構光方案在手機、智能門鎖、閘機等場景下更有用武之地。
國內某家人工智能公司曾經做了一個實驗,選取20款手機接受同一個人臉識別的欺詐攻擊,結果只有iPhone11經受了考驗,而其余19 款國產手機全部被“攻破”,而iphone11 Face ID采用了的正是3D結構光技術,老牌的蘋果與的盧深視這種創新公司,在智能手機與智能門鎖這里都對3D結構光情有獨鐘。
例如,宣稱是小米首款高端智能的3D人臉識別旗艦產品的小米人臉識別智能門鎖X,作為一款“不能失手”的產品,在人臉識別上選擇與的盧深視合作,定制了其3D人臉識別的模組重明,同時保證了安全性、高識別速度等需求。
產業鏈上頭部廠商的認可和產品落地,讓做到了領先的技術快速走向市場,除了小米之外,的盧深視還成為了中海地產的門鎖供應商,實現了B端的批量業務擴展。
當然,智能門鎖只是3D結構光在眾多場景應用的一個典型,后者已經深入眾多對安全需求嚴苛的場景當中。
例如,的盧深視的邊疆三維人像卡口項目在某邊疆省份全境上線,總通行人數超過百億;又例如,金融支付方面,為支付寶提供3D人臉識別模組的創新企業奧比中光當下市值已經達160億,而支付寶的老對手微信支付將的盧深視納入其刷臉支付3D攝像頭供應商名單,它們都在主攻3D結構光。
此外,廣州地鐵18號條線近2萬臺刷臉乘車設備及千萬大庫精準識別系統同樣獲得了來自的盧深視的支持,長沙、深圳、紹興、佛山等城市也在積極探索。
公認的安全性和場景契合度,讓3D結構光方案快速完成著市場落地,也讓的盧深視這類創新企業的業務以項目實際落地的方式迅速擴張。
以“全世界唯一”的安全性為終點,
3D結構光正在完成“三步走”
3D結構光具備多種應用優勢,而其在智能門鎖這里的發展,目前正在經歷“三步走”。
第一步,強化底層技術。
從3D結構光的技術原理可以看出,“光點”的細密程度很大程度上決定了3D重建的精細度,因此,技術方案越“細”,則智能門鎖的安全性就會越好。
所以,能夠看到的盧深視在其技術描述中有“亞毫米級三維感知能力”這樣的表達,原因就在于此,在硬件、軟件層面,廠商們在不斷突破這類底層技術。
目前,的盧深視提供的消費級高精度3D結構光相機宣稱可以投射出三萬特征點、還原人臉高精度3D細節信息。加上3D結構光方案本身的技術優勢,特殊場景(整形、陰影、大角度、戴口罩、雙胞胎相似人群,等)、惡意攻擊(2D照片、3D面具、仿生面具、高仿頭模,等)之類的智能門鎖面臨的潛在風險都能得到有效規避,很難被“攻破”。
第二步,以產品化適配推動場景落地。
技術不僅要先進適用,還要通過需求的適配來更好地實現產品落地,并最終反哺技術本身。
智能門鎖場景下,技術廠商不僅在提供算法這些軟層面的能力,更在提供能夠匹配產品、幫助產品硬件優化的模組等。
比較典型的,的盧深視專門研發推出的3D-FaceID智能模組“重明”,以小體積、長續航來滿足智能門鎖的要求,避免技術上安全但產品上突兀的尷尬,可見3D結構光方案對產業鏈的匹配也十分重要而關鍵。
當然,這種產業鏈適配是有回報的,對底層AI算法而言,智能門鎖的廣泛產品落地將不斷反饋、加速能力的迭代。作為場景類比,前述某邊疆省份首個省級三維人像識別系統累積過檢數億人次,海量實戰數據讓AI算法和硬件創新不斷升級,成為后來者難以追趕的壁壘。
第三步,探索更多3D識別在門鎖產品上的應用空間。
3D結構光的精細化重建能力也意味著“以臉進行身份確定”這件事之外,3D視覺還有其他方面的探索可能,例如,全面的信息采集與立體重建,很明顯可以應用到身形識別上,不只識別臉,也識別整個人。
在極大地解決安全問題后,目前智能門鎖通過3D結構光技術,還在“開門”之外嘗試做動作判斷、表情判斷、行為意圖判斷等,幫助實現更好的智能化的交互體驗,彼時的智能門鎖可能才算得上是真的智能。
當然,在這種技術拓展下,3D結構光的市場空間將變得更大,只不過技術的挑戰也將更明顯,畢竟,當下無論是算法還是硬件都是專門針對面部來設計的。
結語
2021年,國家移民管理局就邊境檢查站項目與的盧深視達成合作,后者在西雙版納邊境管理支隊興海查緝部署3D檢查站方案,對接了智慧公安檢查站省級平臺、移民局大數據平臺,幫助識別和抓捕偷渡人員等工作。
在AI全球競爭,以及數據安全嚴峻的大形勢下,獲得敏感戰線認可的3D結構光技術,實際上已經附帶完成了自主化的工作,例如,的盧深視的3D傳感器相機模組和對應的算法,都具備自主知識產權,這是這個領域高速發展一個不得不提及的重要背景。
而回過頭來看,能夠扼守國門并保證數據安全,這種技術應用到智能門鎖這樣的消費級產品上,其安全性當然也就沒必要質疑和擔憂。
讓用戶實現“全世界唯一”的同時,3D結構光技術本身也在實現“全世界唯一”的獨立自主,這也使得這個賽道有了不一樣的起點。