MIT將AI融入自動駕駛汽車激光雷達傳感技術
自動駕駛汽車激光雷達傳感器的工作原理是發(fā)送紅外光脈沖,并測量它們從物體反射回來所需的時間,從而創(chuàng)建3D點地圖,作為汽車周圍環(huán)境的圖像。
(圖片來源:MIT Computer Science & Artificial Intelligence Lab)
激光雷達的缺點之一是其3D數(shù)據(jù)量巨大,而且是計算密集型的。例如,典型的64通道傳感器每秒產(chǎn)生超過200萬個點。與2D圖像相比,在進行推斷時,由于額外的空間維度,最先進的3D模型需要多14倍的計算,因此,為了有效地導航,工程師必須首先將數(shù)據(jù)分解為2D,但此種方法會導致大量信息丟失。
據(jù)外媒報道,麻省理工學院的團隊一直在研究使用機器學習的自動駕駛系統(tǒng),旨在無需進行自定義手動調節(jié)。研究人員開發(fā)的新的端到端框架可以僅使用原始的3D點云數(shù)據(jù)和低分辨率GPS地圖自動導航,類似于目前智能手機中的功能。
由于涉及到為計算機提供大量豐富的感知信息來學習如何駕駛,因此根據(jù)原始激光雷達數(shù)據(jù)進行端到端學習是一個計算密集型的過程。為此,該團隊必須設計新的深度學習組件,更有效地利用現(xiàn)代GPU(圖形處理單元)硬件,以便實時控制車輛。
博士生Zhijian Liu表示,“我們從算法和系統(tǒng)方面優(yōu)化了我們的解決方案,與現(xiàn)有的3D激光雷達方法相比,達到了大約9倍的累積加速。”測試顯示,新系統(tǒng)減少了人類駕駛員從機器上接管控制權的頻率,甚至可以承受嚴重的傳感器故障。
人們開車穿過隧道,然后出現(xiàn)在陽光下,一瞬間,人眼可能會因為強光而看不清。自動駕駛汽車攝像頭,以及天氣條件較差時,自動駕駛系統(tǒng)的激光雷達傳感器都會出現(xiàn)類似的問題。針對這一問題,麻省理工學院團隊的系統(tǒng)可以估計其對任何給定預測的確定程度,因此在制定決策時,可以權衡該預測。(在從隧道出來的情況下,該系統(tǒng)基本上會無視由于傳感器數(shù)據(jù)不準確而導致的不可信的預測。)
該團隊稱其方法為“混合證據(jù)融合”,因為它將不同的控制預測融合在一起,從而得出運動規(guī)劃選項。麻省理工學院教授Daniela Rus稱,“根據(jù)模型的不確定性,融合控制預測,系統(tǒng)可以適應意外事件。”
在很多方面,該系統(tǒng)本身是麻省理工學院此前的三個項目的融合:
MapLite:手動調整框架,用于在沒有高清3D地圖的情況下駕駛;
variational end-to-end navigation可變端到端導航:機器學習系統(tǒng),使用人類駕駛數(shù)據(jù)進行訓練,學習如何從零開始導航;
SPVNAS:高效的3D深度學習解決方案,優(yōu)化了神經(jīng)架構和推理庫。
研究人員Alexander Amini表示,“我們利用無地圖駕駛的優(yōu)勢,并將其與端到端機器學習相結合,因此不需要專業(yè)程序員手動調整系統(tǒng)?!毕乱徊剑搱F隊計劃繼續(xù)擴展該系統(tǒng),增加現(xiàn)實世界的復雜性,包括不利的天氣條件,以及與其他車輛的動態(tài)交互。