AI視覺商業(yè)化萬字大拷問:因何紛紛扎入零售場景?
“我們相信零售會成為我們第15個營收過千萬的行業(yè)。”商湯集團(tuán)總經(jīng)理尚海龍說。
近三年,商湯代表的計算機(jī)視覺公司以算法和更高的精準(zhǔn)度打破???、大華等傳統(tǒng)巨頭的藩籬,闖入相對封閉的安防領(lǐng)域。
隨著安防市場的紅海化,恰逢線下零售的升級換代,2017年下半年,視覺技術(shù)里大小玩家紛紛押注零售,安防領(lǐng)域的AI明星在思量這會不會成為下一個高地,在小眾領(lǐng)域耕耘已久的潛力股,也在期盼得到走向臺前的機(jī)會。
“通過技術(shù)賦能效果展現(xiàn)了以后,我相信整個零售行業(yè)真正進(jìn)入了從商品或服務(wù)來要利潤,轉(zhuǎn)成向數(shù)據(jù)要利潤,大家能夠意識到數(shù)據(jù)的價值,這個意識的轉(zhuǎn)變是偉大的。”
但是零售場景的分散化和多變性給新技術(shù)帶來了莫大考驗,也讓市場更加不確定。人工智能視覺能否被一片傳統(tǒng)土地接納,這是場復(fù)雜得多的踐行。
看清人臉是基本功
顧客在閘門前面對攝像頭站定,數(shù)秒后連接攝像頭的屏幕上出現(xiàn)機(jī)器采集的人臉,即完成身份認(rèn)定,購物結(jié)束再次刷臉可支付離店。在蘇寧體育Biu門店里,這張臉也正是用戶的逛街ID,攝像頭以及背后的機(jī)器兢兢業(yè)業(yè)地記錄著:男,25歲,在耐克鞋前停留時間較長,購買了一頂鴨舌帽。
蘇寧Biu的視覺解決方案由商湯提供,對于CV(即:計算機(jī)視覺 computer vision)明星公司而言,識別人臉乃看家本領(lǐng)。2014年,商湯創(chuàng)始人湯曉鷗的聯(lián)合實驗室用20萬人臉數(shù)據(jù)達(dá)到98.52%準(zhǔn)確率的成績,超越人眼,在業(yè)界一炮而紅,之后,商湯以技術(shù)優(yōu)勢殺入資金充沛、需求剛性的安防市場。
“圖像四小龍”商湯、依圖、曠視、云從發(fā)展路徑類似,去年都完成數(shù)億元融資。三四年前,全國安防設(shè)備產(chǎn)生的海量數(shù)據(jù)亟待處理分析,比如如何在火車站的人海中扒出流竄的犯罪嫌疑人,把持政府項目的傳統(tǒng)巨頭卻無力消化,人工智能視覺“趁機(jī)而入”。
2017年,尤其是下半年,隨著新零售、智慧零售的概念落地,視覺明星們也陸續(xù)殺入其中,包括商湯、曠視、依圖、圖普、閱面等等。它們以“刷臉進(jìn)場“和“刷臉支付”占到一席之位,商湯與蘇寧聯(lián)手,曠視拿下了阿里巴巴的淘咖啡,圖普把技術(shù)鋪到了天福超市、EasyGo以及OPPO……
兩項功能被廣泛應(yīng)用于無人門店和升級改造中的傳統(tǒng)零售店,這也是目前視覺技術(shù)最被熟知的功能,最直接的效果是可以簡化收銀環(huán)節(jié),節(jié)約成本。
當(dāng)然,初出茅廬,在陌生的零售場域打拼容易么?
“AI不具備普適性,沒有萬能的,不同場景對算法的要求不一樣。相比安防和金融,零售的場景太復(fù)雜多變了。”一位視覺產(chǎn)品經(jīng)理感嘆道。
據(jù)透露,目前的刷臉技術(shù)其實相對簡單。“市場上提供的算法多是正面底庫識別,這種門禁模型做線下零售是有一定的問題。線下零售要做到無感知,可能不是通過注冊的人臉做識別,而是第一次進(jìn)店的抓拍作為底庫,可能光線不好,可能有遮擋,可能是側(cè)臉,這就需要專門的訓(xùn)練。”
尤其是涉及支付環(huán)節(jié),必須人為設(shè)置固定的靜態(tài)場景,強(qiáng)制要求消費(fèi)者配合,即便是人臉識別老大商湯所搭建的蘇寧Biu店也依托于閘門。
“現(xiàn)在謹(jǐn)慎一點(diǎn)的,像各大銀行ATM刷臉取款增加六位密碼確認(rèn);大膽一點(diǎn)的,像蘇寧門口有閘機(jī),結(jié)賬一個個排隊,這樣支付環(huán)境有固定的靜態(tài)場景,準(zhǔn)確率基本可以做到百分之百。大量的動態(tài)比對會成問題。”尚海龍說。
理論上,機(jī)器視覺不是沒辦法抓取非配合條件下的動態(tài)人臉,火車站里抓捕逃犯就涉及到人臉檢測、特征提取、比對多項技術(shù),機(jī)器先在一幀視頻中框出所有的人臉,然后挨個與公安機(jī)關(guān)的照片數(shù)據(jù)庫對照。但問題在于,場景的變化要求對算法同步調(diào)整優(yōu)化。
簡24原本調(diào)用過外部的技術(shù),但后來選擇了自主研發(fā)。“并不是因為外部技術(shù)不好,在機(jī)場這種公共場所,能從茫茫人海當(dāng)中一眼把恐怖分子識別出來,產(chǎn)品挺牛的,但關(guān)鍵問題在于,第一,需要為我們的場景做優(yōu)化,任何的算法都要根據(jù)本地場景優(yōu)化才能達(dá)到最好的效果。第二,它們的訓(xùn)練人群和我們的不一樣。”創(chuàng)始人林捷透露。
同時,人臉本身的局限性能否完全應(yīng)用于零售業(yè)也存在爭議。“我們認(rèn)為外部特征不能作為人的終生ID,或者綁定金融支付,很危險的。”深蘭科技創(chuàng)始人陳海波說。他對自家的“不要臉運(yùn)動”深以為豪,以掃手取代刷臉,掃的是靜脈、動脈和毛細(xì)血管,以每一根血管的分叉點(diǎn)和點(diǎn)與點(diǎn)之間位置關(guān)系為特征值。“我們的N值達(dá)到4億(能與4億數(shù)據(jù)做對比,簡單說,N值越高算法和算力越強(qiáng)),再加上4位手機(jī)號碼,做到了40億。”
公開數(shù)據(jù)顯示,商湯2017年有20億張人臉數(shù)據(jù),2億個體訓(xùn)練,達(dá)到9位密碼時代。
進(jìn)場之后,靠臉的可能性也不大了。
“一說到視覺技術(shù)就想到刷臉,其實這是最為簡單基礎(chǔ)的功能。”林捷說,“進(jìn)場之后拍不到人臉,靠體態(tài)識別這個人,知道他拿了什么商品,這比較難。”
業(yè)內(nèi)公認(rèn)的、視覺技術(shù)應(yīng)用的極致表現(xiàn)為Amazon Go,全程通過機(jī)器捕捉看了什么,拿走了什么,離店后自動扣款,當(dāng)然,為確保準(zhǔn)確性,Amazon Go還采用了重力感應(yīng)器、二維碼、紅外感應(yīng)器等輔助技術(shù)。
深蘭于2016年4月發(fā)布了無人值守零售解決方案,陳海波告訴億邦動力網(wǎng),人與貨關(guān)聯(lián)的算法極為復(fù)雜,“入場時采集到人的數(shù)據(jù),包括人的體型,頭到地面的距離,肩到地面的距離,這是一個綜合數(shù)據(jù),攝像頭一直在追蹤用戶。在商品區(qū)有一條無形的電子?xùn)艡?,手伸進(jìn)去以后觸發(fā)攝像頭開始抓取動作。攝像頭以每秒30幀抓取手,當(dāng)觸及商品時每秒120幀, 同時實時去背,扣掉背景,讓攝像頭都集中看商品,更精準(zhǔn)判斷它是什么。”
“全程要調(diào)動多個攝像頭協(xié)同監(jiān)控,實時調(diào)整每個攝像頭的權(quán)重。如果商品和背景一個顏色,那機(jī)器大腦也沒辦法了。”
你們這方案多少錢?
“零售毛利低,對每一筆投資都會非常謹(jǐn)慎。相應(yīng)而言,它是一定要看到效果才會投資。”尚海龍說。
從安防到零售,作為服務(wù)方的計算機(jī)視覺公司明顯感知到客戶預(yù)算的銳減。
比如,公安系統(tǒng)的視頻監(jiān)控方案并非適用一般的零售商,“它本身使用是公安內(nèi)網(wǎng),一個本地化的服務(wù)器集群,用物理服務(wù)器去承載所有的視頻流,服務(wù)對象的特性決定了方案的設(shè)計。”一位視覺從業(yè)者表示。
普通零售商針對視頻監(jiān)控則必須考慮:第一,本地加服務(wù)器,購買服務(wù)器需要幾萬元,而且需要人維護(hù),還要防止偷盜丟失破損;第二,云加端,視頻流傳到云端處理方案的網(wǎng)絡(luò)帶寬成本加云端GPU服務(wù)成本也不低,傳輸至少一個720P或者一個高清碼流,帶寬少說要4M,一個CPU服務(wù)器,大概阿里是500塊錢一年,GPU是3000塊錢一年;第三,壓縮視頻流上傳云端,會丟幀失真,效果很差。
“政府項目可以說不計成本,以達(dá)到最好的效果,這和商業(yè)的邏輯不一樣。
硬件占據(jù)方案成本中的大頭,包括GPU、相機(jī)以及各類感應(yīng)器等。
后臺分析是店里配備小型硬件處理站還是走云端,包括私有云、公有云還是混合云,廠商們提供了開放選擇。圖普負(fù)責(zé)零售產(chǎn)品的劉凱解釋稱,上不上GPU由客戶需求決定,云端分析處理的好處是及時性更強(qiáng),剛到店的客人馬上就能被識別出來,模型、程序的更新也是在云端完成,無需人工干預(yù),但是對網(wǎng)絡(luò)傳輸要求高;本地化分析則幾乎不占用忙時帶寬,在本地分析完后再在閑時將分析結(jié)果上傳到服務(wù)器。
“根據(jù)客戶實際的需求以及資源的限制來做選擇,沒有最好的,只有最適合的。”劉凱說。
相機(jī)有原本線下就在用的幾百塊的普通攝像頭,也有動輒上千的深度版,還有方案提供商自主設(shè)計的獨(dú)家產(chǎn)品。
普通相機(jī)是單目的,2D成像,而深度相機(jī)通過雙目或3D結(jié)構(gòu)光或加紅外模組實現(xiàn)3D效果,也就可以知道物體離相機(jī)多遠(yuǎn),當(dāng)然價格也更貴。
“我們現(xiàn)在用2D相機(jī),通過算法模擬3D,當(dāng)然,如果用深度相機(jī)模組可以更準(zhǔn),但成本太高了。”一位產(chǎn)品經(jīng)理表示。
原有的設(shè)備可以用起來。“原來已經(jīng)投資過的東西我們不會進(jìn)行破壞性的損傷,攝像頭我們要200萬像素以上就可以,原來超市里已有的攝像頭直接就可以用,并聯(lián)進(jìn)我們的系統(tǒng)就可以。“尚海龍表示。
圖普向天福超市提供的改造方案正復(fù)用了原有攝像頭,對接CRM系統(tǒng)拿到會員頭像和消費(fèi)記錄,自動識別VIP,精準(zhǔn)發(fā)送促銷廣告。
如何把握效果和成本之間的天平,是初來乍到玩家的必修課。
“如果不計成本的話,我們的精度早就上去了。”簡24創(chuàng)始人林捷說。
簡24是Amazon Go的國內(nèi)追隨者。Amazon Go由亞馬遜在2016年底發(fā)布,主打拿了就走、不需排隊的,引發(fā)業(yè)內(nèi)震撼。今年年初,亞馬遜從內(nèi)測正式向公眾開放,而經(jīng)過兩年的時間,技術(shù)圈和零售圈的人也都意識到這只是個“show case”,實在不具備大規(guī)模復(fù)制可能性。
根據(jù)公開報道,Amazon Go在160平米的空間里布置了上百個攝像頭,RGB和深度攝像頭結(jié)合,并采用了紅外線感應(yīng)器和重力感應(yīng)器,盛傳成本高達(dá)千萬美金。
推出了2.0版本的林捷用的是“幾百塊“的普通攝像頭,也不能布置太多,依靠算法迭代來提升精度。
“還是要回到商業(yè)的本質(zhì),攝像頭的價格和數(shù)量肯定對效果有影響,但是在零售場景下,成本太高根本不能收回投資,這個商業(yè)模式就不成立了。”林捷說。
懂零售
一套設(shè)計方案中,算法、硬件、 場景互相適配,構(gòu)成一個完整的三角形。方案設(shè)計得是否符合“商業(yè)的邏輯”,很大程度上取決于對零售的理解程度。
零售是創(chuàng)新工場AI工程院今年的主打行業(yè),聯(lián)合創(chuàng)始人王晶表示,人工智能團(tuán)隊當(dāng)中要有行業(yè)專家,每次見客戶最長的時間花在了解對方的實際業(yè)務(wù)上。
劉凱告訴億邦動力網(wǎng),不同類型的零售商間差異會比較大,但即便同一類型的零售商客戶,在管理上的需求也存在很大差異。
“做家居的客戶會希望我們能按家庭的維度去識別客戶,而賣日用品的客戶可能更急迫于知道有哪些人是回頭客。在同類的零售商中,根據(jù)客戶自身管理目標(biāo)的不同,共性的需求也會在指標(biāo)要求上有差異,如對準(zhǔn)確率、召回率的要求有所不同,差異化的個性化需求,未必在整個行業(yè)間通用。”劉凱說。
王晶認(rèn)為,方案的優(yōu)劣不僅取決于算法,很多時候是工程上的問題。“比如,要從用戶的整個流程體驗的角度考慮,怎樣有一個很好的結(jié)賬流程,讓用戶感覺更順暢,反之不管技術(shù)多炫酷,如果用戶不舒服,商家都不會買單的。”
深蘭在克制技術(shù)的無限延展。“柜子可以只裝四個攝像頭或者六個攝像頭,攝像頭多了,GPU算力需求比較大,成本高?;旧夏愎室庖狄材芡底?,但是問題是大多數(shù)人正常購買,而且如果貨少了,我們調(diào)取視頻也會發(fā)現(xiàn),還和其他公司共享信用,偷竊查出來后就上黑名單了。”陳海波介紹。
即便Amazon Go也有針對零售場景而變通的一面。其貨架使用的重力感應(yīng)器其實存有隱患,理論上,小偷可以快速把商品替換成其他東西(比如一袋沙子)而不被發(fā)現(xiàn),不過考慮到這是多人同在的場景,類似的偷盜實施起來比較困難也就忽略了。
林捷總結(jié)出來一套經(jīng)驗:不要讓技術(shù)花時間在運(yùn)營能夠解決的問題上。“幾十個人擠在柜臺前結(jié)賬,這樣的場景就不要讓視覺科學(xué)家去研究了,機(jī)器分不清楚誰買了什么,就讓顧客排隊好了。”這些取舍建立在零售業(yè)的理解上,技術(shù)大咖補(bǔ)課不足就容易掉坑。“有的(方案)為了做到更好的商品識別效果,會加高貨架的層高,降低層數(shù),一般貨架有5到6層,變成了4層。”林捷強(qiáng)調(diào),這是損傷便利店平效的本末倒置,“如果了解零售,絕對不會在技術(shù)設(shè)計上犧牲平效的。”
商品識別方興未艾
要實現(xiàn)對人貨關(guān)系互動的記錄以及無人結(jié)算,繞不開談商品識別。這也是視覺科學(xué)家在爭奪的新高地,“前幾年我們刷榜刷的都是人臉,刷爛了,現(xiàn)在物體是最難的。”一位業(yè)內(nèi)人士透露。
去年,曠視參加了COCO競賽的物體檢測、人體關(guān)鍵點(diǎn)和物體分割三個單項比賽,獲得兩個第一和一個第二。碼隆科技取得了 WebVision競賽的第一名。
相比人臉識別,商品識別還徘徊在起跑線上。傳統(tǒng)商超、便利店和品牌店升級改造,都一般采用條形碼、RFID這些“老古董”技術(shù),即便繽果盒子這樣的創(chuàng)新項目也啟用了RFID。
“因為RFID是一個比較偏成熟的方案,最早選擇它在創(chuàng)業(yè)上是make sense(說得通)的。圖像識別技術(shù)可能更領(lǐng)先、挑戰(zhàn)更大。”華映資本投資總監(jiān)姜志峰說。
總得來說,人臉相對標(biāo)準(zhǔn)化,可以把人種作為單獨(dú)訓(xùn)練模型,而零售涉及的商品SKU多而雜,每個類別單獨(dú)訓(xùn)練難度大,不可控性更高。機(jī)器識別每張照片的基本邏輯是:每張照片有向量,即多組數(shù)字,某幾個組合起來代表袖長、顏色、款式等特征,機(jī)器根據(jù)數(shù)字判斷自己“看見”的是啥。但是,如衣服這種柔性物體易變形,不同穿法或者扭曲、折疊在圖片中像素排列不同,讓計算機(jī)明白它們是同一件的不同形態(tài)很難。
此外,現(xiàn)在人臉識別已經(jīng)可以把算法做到手機(jī)里,比如刷臉解鎖,而物體識別暫時還要基于GPU或者X86這種高性能的硬件架構(gòu),成本較高。
“WebVision競賽上李飛飛給我們頒的獎。”碼隆創(chuàng)始人黃鼎龍強(qiáng)調(diào)。
和曠視不一樣,物體識別是碼隆們安身立命的根本。此外,國內(nèi)市場上頭部玩家還有衣+、Visenze。
與人臉識別早早收割了安防的麥田不同,商品識別長時間以來被認(rèn)為應(yīng)用場景不明確,空有技術(shù)難變現(xiàn),玩家們在漫長的商業(yè)化探索中走出了不同的萬里長征。
三家業(yè)務(wù)都在電商上下了大力氣。碼隆和衣+最初做的都是以以圖搜圖為核心的to C產(chǎn)品,類似淘寶“拍立搜”,后來轉(zhuǎn)向2B服務(wù),一個建立了Product AI平臺,將識別能力開放給電商平臺、品牌、圖庫等商家;另一個則鎖定了媒體和大屏等,比如,在優(yōu)酷視頻上即看即買,跳轉(zhuǎn)進(jìn)入淘寶購物,即通過衣+的技術(shù)實現(xiàn)。
“線上的調(diào)用量在緩慢增長。”黃鼎龍說,從碼隆的經(jīng)驗拉里看,線上市場有需求,但不會迅速爆發(fā)。為更快打開市場,碼隆還把精力投向商家后端,比如,利用圖像識別技術(shù)實現(xiàn)一鍵生成產(chǎn)品詳情頁功能。
黃鼎龍認(rèn)為,經(jīng)過幾年的數(shù)據(jù)積累和算法迭代,加之新零售風(fēng)潮愈來愈熱鬧,商品識別應(yīng)用于線下的機(jī)會到了。
“這個事情能不能成立取決于是否useable(可用的)和useful(有用的),一方面,在技術(shù)上要達(dá)到基本可用的狀態(tài),這是很重要的前提條件,別人試了不work就不行;另一方面,也得有用,17年隨著零售領(lǐng)域的(興起),大家開始覺得有用。“黃鼎龍說。
Yi+也在向線下零售進(jìn)發(fā),無人店和快消品品牌是其目前主要客戶群體。“我們的數(shù)據(jù)積累,和客戶建立起的反饋機(jī)制,都是難以短時間跨越壁壘。”Yi+產(chǎn)品負(fù)責(zé)人說。
不過,Visenze的興趣還不大,它總部在新加坡,主要為海外客戶提供以圖搜圖技術(shù),例如樂天、H&M等。
CTO李廣達(dá)認(rèn)為,計算機(jī)視覺技術(shù)還沒有達(dá)到大范圍應(yīng)用于實體零售的程度。“計算機(jī)視覺有mission critical(關(guān)鍵任務(wù))和非mission critical兩種場景,區(qū)別在于效果的可信度。攝像頭解決方案可以一定程度上提升效率,但是有些場景還不能完全信任。”
他認(rèn)為,電商環(huán)境的以圖搜圖是典型的非mission critical(關(guān)鍵任務(wù))場景。盡管當(dāng)涉及到一些細(xì)節(jié)屬性,比如顏色、領(lǐng)子類型、袖子長短等等,準(zhǔn)確度會打折扣,但這可以慢慢打磨。
大而無當(dāng)還是前途無量?
商品識別是不是真的“useful”,即能否商業(yè)化、是否值得研究尚存爭議。
圖普科技和商湯暫時都還未涉及。“廠商對這方面熱情還比較高,但可能需求不夠聚焦,如何深度結(jié)合實際業(yè)務(wù)還需要探討。”劉凱說。圖為使用RFID的CITYBOX。
“商品的識別有一些創(chuàng)業(yè)公司在做,術(shù)業(yè)有專攻,市場這么大,我們做好自己的事情就好了。我個人判斷它(機(jī)器視覺識別商品)的價值意義沒那么大。”尚海龍介紹稱,蘇寧Biu店賣球鞋、運(yùn)動衣,感應(yīng)電子標(biāo)簽(RFID)即可結(jié)賬。
RFID在服裝行業(yè)尤其受到歡迎。“視覺技術(shù)可能在某些產(chǎn)品上取代RFID,服裝可能比較難。“馬克華菲CIO兼任電商總經(jīng)理左敬東說。
馬克華菲有100多家智慧門店,商品配置RFID標(biāo)簽,通過物聯(lián)網(wǎng)識別器,消費(fèi)者試穿衣服時站到智能試衣鏡前,大屏可自動識別商品ID,向消費(fèi)者展示模特試穿效果、產(chǎn)品介紹、評價、相關(guān)搭配等內(nèi)容。
除了前端展示,RFID在后端零售庫存管理上優(yōu)勢明顯。“正常門店進(jìn)行庫存盤點(diǎn),3000件衣服,2個人,原來需要半天到1天時間。利用RFID芯片,用掃描槍片式感應(yīng)進(jìn)行群讀掃描,1個人,僅需15分鐘就能完成全部盤點(diǎn)。”茵曼母公司匯美CMO肖海坤表示。
不過,RFID也有未解決的難題:每件商品都要加貼至少三四毛錢的標(biāo)簽,人工和材料成本高,且遇金屬和液體等不識別或效果差。
除了機(jī)器視覺和RFID,市面上的還有消費(fèi)者自己拿商品掃碼結(jié)賬、重力感應(yīng)等方案。如下圖物美超市的自助收營臺。
“掃碼對商戶來說成本低且簡單,但建立在信用基礎(chǔ)上,盜損大,且顧客自己動手影響用戶體驗。重力感應(yīng)是老技術(shù)在零售領(lǐng)域的新應(yīng)用,無法判斷具體哪件商品,知道哪個貨架被動過。”
陳海波本人是機(jī)器視覺忠實擁護(hù)者,“未來商店一定是沒有營業(yè)員,商品、編碼、條形碼不存在,商品一定要能夠被遠(yuǎn)距離非接觸識別。”
不單單是未來,也有人已然找到了細(xì)分場景的即時需求。
王晶認(rèn)為不能用RFID的場景也是機(jī)器視覺的機(jī)會,比如蛋糕店,“蛋糕都是用盤盛的,怎么貼標(biāo)簽?”還有超市的自助稱重機(jī)也可以改用視覺識別,因為“在顯示屏的一頁頁商品中區(qū)分查找蛇果和富士蘋果的體驗很差”。
國外還有專門從事快消品貨架識別的Trax,在全球50個國家有175個客戶,不乏可口可樂、百威、雀巢、漢高、百事這樣的大品牌,每月處理2.5億的SKU產(chǎn)品。
剛剛就任中國區(qū)負(fù)責(zé)人的王茜介紹,Trax已形成“交鑰匙”式解決方案:兩米多的貨架只需一個成本“幾美金”的攝像頭,品牌商使用手機(jī)拍照即可。
最基本的,品牌商銷售代表把貨架照片上傳至云端解析,監(jiān)督門店;零售商安裝固定攝像頭,實時監(jiān)測動態(tài)變化;也可以在冰箱上裝上小小的攝像頭,每開關(guān)一次拍攝一張照片,記錄銷售情況。Trax聲稱,服務(wù)的快消品公司斷貨率下降10%到15%,整體銷售業(yè)績提升3%到5%。
Trax核心市場在美國,今年1月正式進(jìn)入中國,目標(biāo)三年內(nèi)中國市場年收入達(dá)到1億美元。
用視覺技術(shù)識別貨架商品在國內(nèi)少見,土生土長的Yi+也打算深耕。“國內(nèi)的快消公司相對傳統(tǒng),我們的本土優(yōu)勢比較明顯,而且以服飾和商品識別起步,在零售方面也有優(yōu)勢。”銷售負(fù)責(zé)人稱。
他表示,貨架識別在國內(nèi)處于空白狀態(tài),快消品公司也有迫切需求。“它們一般需要向超市或者門店交納進(jìn)場費(fèi),獲取貨架數(shù)據(jù)非常關(guān)鍵,很關(guān)心自己的貨擺得好不好,銷售量好不好,每天有什么變化,之前都沒辦法及時統(tǒng)計。”
當(dāng)然,蛋糕店和超市愿不愿意買創(chuàng)新工場的視覺方案,Trax能不能賺到1億美元,Yi+能不能成功挖掘到本土客戶,這些都將被2018年所檢驗。
“我們希望通過AI降本增效,如果兩點(diǎn)都能做到的話,我們就會把它商業(yè)化落地,如果最后得出的結(jié)論是用視覺無法真的做到的話,可能就不會做類似的產(chǎn)品。頂多做點(diǎn)展示,表明我們有這個能力而已。”正在關(guān)注商品識別的計算機(jī)視覺產(chǎn)品經(jīng)理說。
技術(shù)賣給誰?
陳海波喜歡向投資人就什么零售項目值得投提建議,他本身確實也在密切關(guān)注,因為這決定了技術(shù)要賣給誰。
他認(rèn)為,AI技術(shù)提供方人力成本高昂,必須要接規(guī)?;捻椖浚鴨蝹€項目不值得投入。“如果客戶開一個店做秀,沒有意義的。我們要拿下市場,就必須找到具備成千上萬臺采購量的商家。我們的科學(xué)家很貴的,不值得為一次性項目投入。”
目前市場上的采購方從形態(tài)上看有貨架、冰柜、無人BOX創(chuàng)業(yè)公司,也有便利店、商超、賣場等傳統(tǒng)零售商,不同類型的門店客流量不同,SKU不同,需求也千差萬別。
無人店是市場上的主力買家,其核心需求在于離店的身份識別和收銀結(jié)算兩大項技術(shù),以多金、舍得砸錢給技術(shù)公司留下深刻印象。
“互聯(lián)網(wǎng)公司是資本燒錢模式,重效果,不太講成本,要上最好的設(shè)備。”一位產(chǎn)品經(jīng)理透露。
不過,陳海波放出話不愿意接無人BOX的活兒。“我們調(diào)研過,根本不賺錢,短期內(nèi)也難以規(guī)模化開店,中國的零售店已經(jīng)很多了,沒有那么大的市場空間,不是那么多地方需要。”
深蘭現(xiàn)在的業(yè)務(wù)重心在貨架和自動販賣機(jī)的改造上:增加視覺技術(shù),即拿即走,解決盜損問題,把它們變成貨柜或者風(fēng)幕柜,出售毛利率更高的鮮食、水果和便當(dāng)。
參考日本市場,中國自動販賣機(jī)的潛力還未被完全激發(fā)。而貨架相比其他零售形態(tài)與消費(fèi)者距離更短,也算進(jìn)步。但是,技術(shù)方案商們對貨架智能化節(jié)點(diǎn)是否到達(dá)的看法還不統(tǒng)一:低門檻、弱技術(shù)的貨架正忙于搶位,真的有時間和金錢顧及把自己升級為智能化產(chǎn)品?
不可否認(rèn),創(chuàng)業(yè)公司愿意嘗試新技術(shù),但技術(shù)也是它們區(qū)別于傳統(tǒng)玩家、立足市場的核心。簡24選擇自主研發(fā),繽果盒子也發(fā)布了以視覺、傳感器、超聲波多項技術(shù)替代RFID的解決方案,并聲稱已引入全球頂級人工智能專家,正與國內(nèi)重點(diǎn)211院校合作共建國際人工智能實驗室。
一邊是火焰,另一邊則是冰山。
相比創(chuàng)業(yè)公司對新技術(shù)的熱情,傳統(tǒng)零售被吐槽“感興趣看看”、“掏錢欲望不強(qiáng)”。雖然此類玩家有大把的“試驗田”,但看過花花綠綠的PPT和demo視頻,再親自與技術(shù)提供方談一談,心便涼了。
當(dāng)然,一位曾試圖采購視覺技術(shù)的品牌操盤手也抱怨:“幾平米地方的改造要好幾萬,還省不了一個員工,我干嘛要做?”
業(yè)內(nèi)人士介紹,目前人工智能在降低成本和提升業(yè)績上還不能發(fā)揮顯著作用,難以被零售商真正地落地采購。原因在于,算法優(yōu)化是一個長周期的、需要“活數(shù)據(jù)”的過程:先有一套標(biāo)準(zhǔn)算法,然后找場景落地,之后數(shù)據(jù)回流,再對回流的數(shù)據(jù)做算法的差異化訓(xùn)練。甚至有人推測,整個模型跑通至少需要三年時間。
“現(xiàn)階段零售業(yè)對視覺技術(shù)的認(rèn)知還不足,預(yù)期或過高或過低,而前者占大多數(shù)。”Yi+產(chǎn)品負(fù)責(zé)人表示。
從算法模型優(yōu)化的角度講,傳統(tǒng)的連鎖商超、品牌店、便利店都是不錯的標(biāo)的。無人店數(shù)量太少;賣場雖然規(guī)模大,但是洶涌的人流對機(jī)器運(yùn)算造成不小壓力。
“說實話,現(xiàn)在的項目是賠錢做的,我們的目的還是和客戶一起成長。”一位從業(yè)者坦言。
“對于大部分AI公司來說,數(shù)據(jù)其實挺難拿的,一方面要有客戶愿意一起優(yōu)化,另一方面,投入的人力也相當(dāng)可觀,需要研究人員來做單獨(dú)訓(xùn)練。“另一位業(yè)內(nèi)人士說。
王晶表示,數(shù)據(jù)量太小的店不是早期階段最理想的案例,優(yōu)先從AI能夠帶來更大效應(yīng)的連鎖店開始,而且線下門店在線化程度低,很多時候要重新開始積累數(shù)據(jù)。“有的傳統(tǒng)門店P(guān)OS機(jī)版本太低,以前的數(shù)據(jù)都無法調(diào)取。”
AI公司通常被認(rèn)為核心競爭點(diǎn)在于算法、數(shù)據(jù)和算力,而事實上落地能力也是重中之重。“不能忽視的是,用戶反饋機(jī)制完善度非常重要,你多久拿到用戶新的反饋,從而修改你的方法,節(jié)奏是怎么樣的,有沒有建立自動的傳輸流程。”Yi+產(chǎn)品負(fù)責(zé)人稱。
這也意味著AI公司搶占市場的速度異常重要。“如果前期用技術(shù)優(yōu)勢解決一個商家比較著急的問題,建立起信任,然后大家一起優(yōu)化方案,如果這個流程開始跑起來,其他人進(jìn)入就比較難。”
終極目標(biāo)是分析預(yù)測
“前端獲取了數(shù)據(jù)之后的東西特別重要,可以幫助門店做銷量預(yù)測、選品建議、個性化營銷。”王晶說。
王晶表示,人工智能的作用不僅僅在于節(jié)省人力成本,而且可以把線下用戶行為轉(zhuǎn)為在線化的數(shù)據(jù),有了數(shù)據(jù)可以幫零售店主做更多的事情。
一位業(yè)內(nèi)人士講解道,AI的落地分為感知、理解、推理關(guān)系三個環(huán)節(jié),直到可以告訴人該怎么做的時候才是AI真正有價值的時候。
王晶說,像7-11這樣的便利店選品很大程度上依賴于店長的個人經(jīng)驗,以銷售數(shù)據(jù)為出發(fā)點(diǎn),結(jié)合第二天的天氣和周邊環(huán)境等情況預(yù)判消費(fèi)心理并訂貨,而人工智能可以綜合更多因素做出智能化決策。
“通過攝像機(jī)等傳感器,店主可以掌握消費(fèi)者全流程的行為,消費(fèi)者從進(jìn)店起就被識別出了是誰,是不是會員,店內(nèi)看了哪些東西,對哪些產(chǎn)品感興趣,在哪個區(qū)交互多,結(jié)賬時買走了什么東西。”
目前,市面上的視覺方案也引入了大量客戶分析功能,比如,客戶畫像、客流統(tǒng)計、熱點(diǎn)分析、動線規(guī)劃等等。
在圖普科技的一個公開案例中,某大型餐飲連鎖每天晚上在8點(diǎn)半組織營銷活動,經(jīng)過圖普科技的重新統(tǒng)計尋找人流量最高的時段,圖普科技通過數(shù)據(jù)分析發(fā)現(xiàn)8點(diǎn)30分比8點(diǎn)45分差了10%的人流,比9點(diǎn)差了15%的人流。“同樣的成本投入情況下,選錯了最有概率出現(xiàn)最多人的時間點(diǎn),長此以往會有很大損失。”圖普科技CEO李明強(qiáng)說。
基本各家官網(wǎng)和PPT都有類似的案例,但是也存在質(zhì)疑:這些過渡性功能一定要通過視覺技術(shù)來解決嗎?
“客流分析不是這波視覺技術(shù)帶來的,十年前就有解決方案了。”一位業(yè)內(nèi)人士坦言。
比如,大型商場用AP采集數(shù)據(jù),統(tǒng)計客流數(shù)量,通過MAC地址反向做人群畫像。早在2014年銀泰就推廣智能機(jī)采集用戶身份,大數(shù)據(jù)公司據(jù)此提供標(biāo)簽,從而實現(xiàn)精準(zhǔn)營銷。
此外,紅外、藍(lán)牙、雙目視頻分析都是相對成熟的信息收集手段。
百安居去年在上海使用天貓的解決方案推出了首家智慧門店,公開信息中視覺技術(shù)中只有人臉識別,未提到對身體、動作的識別,而據(jù)天貓電器的高級專家吉家在演講中透露大量使用了藍(lán)牙定位技術(shù)。“在整個接近一萬平的場內(nèi)放了很多藍(lán)牙,整個過程你在哪個模塊哪個區(qū)間關(guān)注什么都可能會被記錄。”
有業(yè)內(nèi)人士表示,傳統(tǒng)方法在精度和顆粒度上不如視覺檢測,但憑借低成本可能會分流走客戶。
同時,現(xiàn)有視覺技術(shù)尚未給客流分析在效果上帶來質(zhì)的提升,比如,熱點(diǎn)識別可以確定某個貨架或者區(qū)域人多,但又無法落實到具體商品上面。
“現(xiàn)在核心是要把數(shù)據(jù)收集起來,不在乎用的是更傳統(tǒng)的方法,還是說更高端。”Yi+產(chǎn)品負(fù)責(zé)人指出。
當(dāng)然,視覺技術(shù)提供商也可以引入視覺以外的、已成熟的技術(shù)和產(chǎn)品。圖普科技的角色在向集成商靠攏,涉及畫像識別、滯留時長、跨天跨門店回訪識別、軌跡追蹤、熱力圖、自定義報表、支付人臉綁定等,也有完整的產(chǎn)品形態(tài),包括web,小程序和API接口。
集成商也是計算機(jī)視覺公司的一個發(fā)展方向,否則有可能成為CRM、POS等傳統(tǒng)零售服務(wù)商的一個分支而已。不過,集成商對客戶資源、整合能力要求很高,而且創(chuàng)新工場、阿里巴巴、騰訊等大玩家都在向其靠攏。
當(dāng)然,總體而言,線下零售還只是大多視覺公司撒出去的眾多種子之一,金融、醫(yī)療、汽車等諸多行業(yè)也在開花結(jié)果,要不要真的扎根零售還沒有定論,畢竟圖普科技負(fù)責(zé)零售的產(chǎn)品和銷售大概二十個人,商湯的零售銷售只有兩人。
“現(xiàn)在是相互挑戰(zhàn)的過程,類似商湯這樣的公司與??抵g的關(guān)系,傳統(tǒng)集成商技術(shù)上有短板,但渠道和系統(tǒng)資源有優(yōu)勢。是單項技術(shù)發(fā)展成面,還是面補(bǔ)足技術(shù),還挺難說的。”一位業(yè)內(nèi)人士表示。