索尼開發(fā)世界首款配備AI處理能力的圖像傳感器
對于商業(yè)應(yīng)用的攝像機和邊緣計算,有兩種典型的策略:首先,使用一堆沒有智能的傻瓜攝像機,將數(shù)據(jù)發(fā)送到本地化服務(wù)器進行預(yù)處理,然后再上傳到云端進行存儲和分析(或者跳過預(yù)處理直接發(fā)送到云端)。其次,使用智能攝像機,在本地完成所有處理,然后發(fā)送到云端存檔。
索尼計劃專注于在零售和工廠自動化中大規(guī)模部署支持AI的相機,以及為其AI圖像傳感器開發(fā)基本推理模型。
兩者都有權(quán)衡。廉價相機通常需要一個龐大而昂貴的IT基礎(chǔ)設(shè)施,當處理發(fā)生在其他地方時,存在延遲問題。昂貴的相機耗電量大,可能需要一些網(wǎng)絡(luò)功能。兩者都需要安裝專業(yè)知識。
索尼負責(zé)商業(yè)和技術(shù)創(chuàng)新的副總裁馬克·漢森說:“想象一下,一家擁有1000多臺攝像頭的零售店正在播放大量視頻。如果攝像頭訂閱是預(yù)處理的,則必須安裝多個服務(wù)器才能連接所有這些攝像頭,如果將視頻的100%流式傳輸?shù)皆贫?,則需要支付大量的回程和存儲成本,此外還有延遲。這些問題,再加上日益增長的隱私問題,特別是在歐洲,要求限制個人圖像在本地局域網(wǎng)之外分發(fā)的能力,讓我們認為必須有更好的方法?!?/p>
事實上,這是漢森集團對客戶(尤其是零售業(yè))在實施邊緣計算解決方案時,所面臨的固有挑戰(zhàn)和真正的困難有了更深入的理解,其中許多是定制項目,導(dǎo)致他們開發(fā)了世界上第一個人工智能圖像傳感器IMX500。
漢森說:“我們的想法是,如果我們能在邊緣解決使流程復(fù)雜化的問題,我們將以較低的成本為客戶縮短上市時間。”
索尼IMX500圖像傳感器是利用現(xiàn)有背面照明的圖像傳感器的邏輯延伸,它是第一款配備AI處理能力的圖像傳感器。這一特性是通過將邏輯芯片歷史性地放置在傳感器的正面并將其重新定位到背面來實現(xiàn)的,從而使傳感器有更多的像素來提高感光度,寬總線結(jié)構(gòu)將數(shù)據(jù)從圖像傳感器傳輸?shù)綀D像信號處理器(ISP)。
在索尼新推出的IMX500上,像素芯片(約有1230萬像素用于捕獲信息)采集的信號同樣通過ISP運行,AI處理在邏輯芯片的處理階段完成。物體識別只需3.1毫秒,提取的數(shù)據(jù)作為元數(shù)據(jù)輸出,減少了處理的數(shù)據(jù)量。
IMX500的邏輯芯片有一個傳統(tǒng)的圖像傳感器操作電路和一個專門用于AI信號處理的索尼數(shù)字信號處理器,以及用于AI模型的內(nèi)存。圖像識別的閃電般的速度,以及在數(shù)據(jù)到達網(wǎng)絡(luò)前將所有無關(guān)數(shù)據(jù)拋出的能力為新的應(yīng)用開辟了可能性,從檢測面罩到區(qū)分人類還是機器人進入工廠的限制區(qū)域。
索尼從4月份開始銷售裸芯片,并預(yù)計將在6月份推出一款打包版(IMX501)。漢森說,為了讓這項技術(shù)獲得吸引力,他創(chuàng)造了一個“邊緣圖像平臺”,它必須易于測試和大規(guī)模部署,而且成本不會讓客戶的底線爆炸。為了做到這一點,漢森設(shè)想了一套簡單的硬件解決方案,其中有一系列選項或用例供客戶選擇,沒有大規(guī)模定制或?qū)崿F(xiàn)噩夢。
實現(xiàn)這種簡單程度的關(guān)鍵在于參考設(shè)計和與微軟等擁有現(xiàn)有開發(fā)社區(qū)的組織、系統(tǒng)集成商和獨立軟件供應(yīng)商的合作伙伴關(guān)系,這些公司擁有索尼所瞄準的應(yīng)用程序的經(jīng)驗,除了在機器學(xué)習(xí)和面向微型機器語言的工程方面的專業(yè)知識外。年中,索尼宣布與微軟Azure合作,利用微軟的基礎(chǔ)設(shè)施實施一些智能相機解決方案。
雖然漢森說理論上沒有任何東西可以阻止堆棧技術(shù)的增強,比如深度傳感,但今天的主要焦點是開發(fā)IMX500的應(yīng)用程序。最初,索尼計劃將重點放在零售和工廠自動化領(lǐng)域大規(guī)模部署支持人工智能的攝像頭,以及開發(fā)基本推理模型。
漢森說:“我們是第一批這樣做的公司,所以我們需要進行大量的學(xué)習(xí),以了解如何最好地將這項技術(shù)商業(yè)化。策略的一部分是對概念進行驗證,以便我們能夠快速了解哪些有效,哪些無效,并將我們的發(fā)現(xiàn)反饋到工程過程中?!?/p>