刷臉支付將會成為人臉識別下一個引爆點

4月22日-23日,2015中國移動支付產(chǎn)業(yè)論壇在北京召開,與會并發(fā)表《刷臉支付助力移動生活》演講,他表示人臉識別技術(shù)由于大數(shù)據(jù)的時代,由于等等算法的提升,有了很大的進步。因此在跨場景人臉確認這一步已經(jīng)做的比較成熟。所以,他提到在人臉識別支付上就會成為人臉識別下一個引爆點。
演講速記:
非常榮幸有機會在這兒跟各位朋友交流一下人臉識別在移動支付上的應用。來了很多老總和朋友,對這個行業(yè)分析非常清晰。作為中科院的科學家,他覺得有這個機會給大家從技術(shù)的角度講一下現(xiàn)在比較熱,比較火的生物識別技術(shù)在支付領(lǐng)域的應用,他覺得很榮幸。
他跟大家報告的有四個方面。首先,簡單介紹一下他們中科院,他們這個部門研究這個事情的背景。他自己在UIUC博士畢業(yè),他的到導師是Thomas Huang教授,他是美國的工程院院士,全球IT業(yè)界譽為計算機視覺之父。他們在美國期間,從2007年開始,到2011年參加了一系列圖像和視頻的國際比賽,基本上都能夠獲得世界冠軍。
因此,在2011年,中科院是跟UICC還有新加坡國立大學聯(lián)合成立了智能多媒體研究中心,就落戶在重慶研究院。所以,他們就一起來聯(lián)合研究人臉識別技術(shù)。2015年中科院重慶研究院又聯(lián)合加州科技,是A股的上市公司和杰翱資本一起成立了云從科技。這個公司專注于人臉識別方面的應用,主要在安防和金融兩個領(lǐng)域來展開,這是他們自己背景的一個介紹。
第二、跟大家分享一下關(guān)于人臉識別在金融上面的應用。他們之所以現(xiàn)在提出要用生物識別技術(shù)作為一個傳統(tǒng)的移動支付的一個輔助,主要是因為傳統(tǒng)意義上的支付由于是人工操作比較多。因為以前人民銀行,包括證監(jiān)會也沒有開放可遠程做這個事情,所以他們基本要在柜臺做柜面操作,肯定就存在排隊、各種響應的問題。另外,他們上班時間也很忙,所以要做到7×24小時服務,用人工也是很困難。第二、實際人工操作也并不是很安全。他們國家要求按照人民銀行和銀監(jiān)會的要求,必須要強識別認證。也就是說,必須跟本人身份證,所有的金融行為要求是在本人真實意愿下面的行為。但是,實際上身份證照片跟本人是不是同一個人,用人眼來看是非常不靠譜的,后面有具體的數(shù)據(jù)來說明這一點。這是一方面。另一方面由人工操作實際上是經(jīng)常犯錯的,315的時候也曝光,包含像工行、農(nóng)行這樣的大行,因為人工操作造成的錯誤,造成的冒認很大經(jīng)濟上的損失是很常見的。第三、他們用人工的操作,實際上很麻煩。他在去年就跑銀行很多趟,基本上都是一些很小的事兒,比如打印一個流水單,或者改密碼,一系列的事都必須到銀行,還面臨漫長的排隊,這些事情他們都是有辦法通過高科技的手段來簡化的。
因此,他們采用人臉識別技術(shù)作為它未來高科技的一個技術(shù),它實際上具有幾方面的優(yōu)勢。第一方面,人臉識別技術(shù)它實際上比人工的識別要更安全。他們目前人臉識別的水平已經(jīng)遠遠的超過人眼的水平。這個可能各位在媒體上也經(jīng)常能看得到。實際上人臉識別很多對人來說,覺得很難的,包含像雙胞胎一類。因為電腦可以很精確的識別一些人在尺度上覺得很接近的東西,但是可以識別的很清楚。第二、當然采用人臉識別,包含他們今天討論的要有移動支付,它的方便性遠遠超過在柜臺人工的操作。第三、它當然也是很高效的,因為這個本身也是他們?yōu)槭裁唇裉煸谶@兒討論的一個原因?! ?/p>
但是,他這個跟大家科普一下,事實上大家都說人臉識別,大家講人臉識別概念的時候,實際上站在專業(yè)的角度來說,它實際上還有很多的區(qū)分。他今天跟大家講幾個概念:
第一、人臉確認和人臉識別,這是兩個不同的概念。人連確認是他給你一張圖,或者一個視頻,告訴你這是張三,機器學定這是不是張三。人臉識別的問題,他現(xiàn)在給你一張圖,也不知道是誰,你幫他識別。所以,人臉確認的難度要遠遠低于人臉識別,這是兩個不同的概念。
第二、他們稱為相同場景和跨場景。相同場景是指他們所有做人臉識別存在一個注冊的過程和測試的過程。如果注冊的圖片和測試的圖片是在一個同樣的基本相似的環(huán)境下,或者采集設備相似,或者時間跨度不是很大。上面的兩張圖就是相同場景的情況,這種情況下,識別難度相對來說比較低。比如他們經(jīng)常看到一些人臉識別考勤,他們先去注冊,接下來在相同行業(yè)再去使用,這個比較簡單??鐖鼍?,就是指注冊的圖片,不管時間還是采集的環(huán)境,和測試的環(huán)境不一樣的情況,叫跨場景。比如他們經(jīng)常使用到的,他們注冊的是一張身份證照片,測試圖片是一個現(xiàn)場的手機拍攝,或者視頻中的照片。這個時候因為它本身的采集條件,年長日久,大家覺得長的不太像,這種情況下,跨場景的難度高很多。
第三、配合和非配合。所謂配合就是指紋識別對象本身是想通過這個識別的。這種情況下,它會很認真的跟這個混淆配合。這種配合的情況下,首先能夠稍微長一點時間,各種條件都會比較簡單。非配合的環(huán)境是指識別對象不配合這件事情,比如公安、反恐應用中。通常他們追查逃犯的時候,逃犯意愿上不希望被識別。
這三個大的條件,定義出來人臉識別完全不同的應用。他簡單的舉了幾個例子,畫了一個圈看這個事情。如果在相同場景下做人臉識別,這就是他們以前大家看到的因為是相同場景,所以難度比較小。第二、跨場景,但是是人臉確認,就是右邊這種場景,就是他們在今天這個論壇上,他要用到的人臉的移動支付,這就屬于跨場景,他們經(jīng)常的注冊跟實際測的完全不一樣。但是,大是一個確認問題。因為他希望通過他的錢包付錢,基本上看是還是不是。同時,這也是一個配合的情況。如果是跨場景的人臉識別,基本在公安、追逃的時候要做的,場景不一樣,同時不知道這是一個誰,只是在一個很廣泛的黑名單庫希望把他搜索出來。
人臉識別有時候覺得好像做的挺好,有些時候又不能用。這跟他們這些大的分類有很大關(guān)系,跟今天技術(shù)走到哪一步有很大關(guān)系。所以,過去一些年他們可以看到門禁考勤可以用,其他場景基本上都是不能用的。但是,到現(xiàn)在在過去的這兩年,他們的人臉識別技術(shù)由于大數(shù)據(jù)的時代,由于等等算法的提升,有了很大的進步。因此在跨場景人臉確認這一步已經(jīng)做的比較成熟。所以,他們提到在人臉識別支付上就會成為人臉識別下一個引爆點。再往后面,才是跨場景的人臉識別,所以公安廣泛追逃上才是下一個場景的應用。
他提出兩個移動支付人臉識別的場景,他們只要證明是他本人,他們會把這個照片與公安聯(lián)網(wǎng)的庫,或者之前注冊的人臉相比對,如果通過,它就可以付錢。這是跨場景配合的人臉確認問題。
移動支付的另外一個場景,比如在實體店,他們在出去逛街的時候看到好的東西,但是他是會員,沒有帶卡,也沒有帶錢包,他們怎么辦?這個時候他們可以在柜面上,如果刷臉支付,你告訴他們柜員,他是VIP,一認證就可以付錢。這是跨場景配合的人臉識別問題,因為這個人臉識別范圍比較有限,而且是配合場景。因此,這個難度比前面一個難度略高。
實際上在金融業(yè)非常關(guān)心的一個問題是刷臉支付安全性到底有多高?首先他們看看這個難度有多高?這個地方現(xiàn)在ABCD每一組,一張是身份證讀卡器讀出來的圖片,一張是實際實拍的現(xiàn)場照片。實際要判斷他是不是本人?他相信你肉眼看也是很難的。這張答案是前面兩組不是同一個人,下面兩組是同一個人。他們通過2000對身份證的照片發(fā)現(xiàn)一個問題,人眼識別率其實只有72%,但是目前機器的識別率能到96%。其實現(xiàn)在機器的識別率已經(jīng)遠高于人了,但是它也做不到百分之百的準確,還有4%的錯誤率,但是人眼更不靠譜,大家已經(jīng)習慣了,也就這么過去了。但是,他們?nèi)匀粦摽梢圆捎脵C器提升這個效率。
第二、如果他們有自動的識別,還要考慮到攻擊的問題。比如假如說他們覺得馬云很有錢,他們想偽造他花他的錢,你有兩個辦法,一個是事先在網(wǎng)上下一些他的照片,用照片對著手機,偽裝他來攻擊。這種情況他們要用活體檢測,你只是一張照片,他判斷你這個不是活體,就不能夠通過。你說他們下一段馬云的演講視頻,對著手機偽裝他,這個就叫視頻攻擊。事實上他們應對視頻攻擊,現(xiàn)在已經(jīng)有全系列的動作識別、語音識別和語義識別,三位一體的活體檢驗的方法。也就是他們可以自動的提示你做一些隨機的動作,或者讓你讀一個數(shù)字串,通過識別你的唇型判斷你是不是按照他的要求做的。
所以,為什么說人臉識別相對比指紋識別等等其他的一些生物識別手段,對于防攻擊有一個安全的問題。因為活體安全問題,在手機上是做不了的??偨Y(jié)起來,人臉識別在準確性上面做不到百分之百,但是能比人眼準很多,它對人眼是一個很好的補充。從安全上來說,各種工具手段是有一個很好的防范。
第三、核心技術(shù)。實際上人臉識別這個技術(shù)是需要用數(shù)據(jù)和系統(tǒng)這兩塊來支撐這個理論體系。過去實際上規(guī)模比較小,2010年以前,人臉識別效果很不怎么樣。到2010年以后,有大規(guī)模的數(shù)據(jù)以后,人臉識別有很顯著的提高。但是,光是有大規(guī)模數(shù)據(jù)是不夠的,這個數(shù)據(jù)你只是在外面胡亂采的數(shù)據(jù)是不夠的,他們需要有所謂結(jié)構(gòu)化的數(shù)據(jù)。就是他們實際上任何一張照片,一張人臉照片有很多屬性,不光是指他是誰,他的ID是一個屬性。同樣,這張照片是在什么光線,有沒有遮擋,有沒有角度,有沒有表情等等一系列的標簽,聯(lián)合定義了這個照片。他們實際上平時如果只是在網(wǎng)上隨機下載照片,或者裝一個攝象頭在路上隨便拍,是缺乏規(guī)范的照片。這種照片對他們識別來說是不夠的。
因此,他們中科院在重慶自己花了很大的力氣做了全球首創(chuàng)的可移動、可拆卸的這么一個采集陣列。有上百個攝象頭,他們把這套設備可以完全同步獲得所有決卻的你的表情、角度、光線、遮擋等等一系列都定義好的照片,而且他們在通道、在銀行,還有在其他任何地方可以做這個事情,這個叫做超大規(guī)模的結(jié)構(gòu)化的數(shù)據(jù),通過這樣的數(shù)據(jù),才能有對應的更精確的算法,把這個識別率做到很高。
第二、人臉識別其實有超過20個模塊來輔助,成為一個算法的系統(tǒng),它才能在實踐中非常好用。因為真正如果在支付中用人臉識別,要應對各種情況。比如現(xiàn)在光線不行,要給用戶很好的提示,他對焦不準,要給他提示,大小不夠,要給他提示,等等一系列,你要生成他的證件照等等。只有這樣才能真正做到又安全,又方便,實現(xiàn)他前面講的真正比人更方便。因此,這需要有一個很大的算法平臺,這需要有很多科學家做這個技術(shù)積累,而不是簡單在數(shù)據(jù)庫上面做比對實驗。因此,這個也是他們基于整個一大套理論在過去很多年集成研究這個事情,提出一套理論把它做到實踐化。
實際上人臉識別以前更多用在安防上面。他們本身做的人臉識別產(chǎn)品已經(jīng)形成一系列的自動通關(guān),智能攝像機等等一系列產(chǎn)品,這也產(chǎn)品本身已經(jīng)在國家很多安防領(lǐng)域產(chǎn)生了重要的應用。
他只舉一個例子,他們在新疆邊防所有的總隊使用他們?nèi)四樧R別的通關(guān),為新疆的安全他認為做是蠻大的貢獻,這是最開始在喀什邊防站做人臉識別的通關(guān)系統(tǒng),當時一線官兵對他們感謝,再推廣到全疆所有的邊防站,現(xiàn)在所有人臉識別的系統(tǒng)在新疆的小區(qū)、加油站,在公安局各個地方都已經(jīng)發(fā)揮了很重要的效率。應該說在公安的應用中,它實際上比在金融的應用更難一些,因為很多情況存在非配合的情況。
實際上金融中使用的時候,如果用來做遠程的開戶,或者遠程的支付,它基本上是一個云身份認證系統(tǒng)。他們會在這個金融機構(gòu)服務器所在的這一端有一個云的系統(tǒng),可能是私有云上面。同時,前端他們可以在它的柜面上使用人臉識別,它就是柜員的一個輔助。人眼看到的實際上是不準的,它實際上是一個安全的加強。也可以在手機,或者Pad等等上面使用,把柜臺服務變成遠程的。
那么,整個的使用流程,它主要的目的有這么多流程,對用戶的提示,反復的角度遮擋等等的一個計算,對于這個唇語識別,人體的檢驗,整個是保證做到既安全,又方便。
最后這個地方他列舉了一下,實際上在云認證系統(tǒng)里面,人臉識別可以使用的范圍是非常多的。目前他們公司,中科院他們云從公司已經(jīng)跟一系列的證券公司以及銀行開始合作,大家很快會看到在一些大的證券公司銀行開始上線使用的人臉識別技術(shù)。他相信,人民銀行也會很快出臺細則,支持整個生物識別技術(shù)在金融領(lǐng)域的廣泛應用。謝謝大家!