影音先锋熟女少妇av资源,国产精品52页,2021精品国产自在现线看,亚洲高清中文字幕在线

物聯(lián)傳媒 旗下網(wǎng)站
登錄 注冊

“刷臉識別”不過小試牛刀,不斷進化的深度學習將會怎么去改變世界?

作者:不詳
來源:物聯(lián)網(wǎng)智庫
日期:2016-03-28 12:15:59
摘要:隨著人工智能的大熱,深度學習技術也隨之走到人們的事業(yè)之前,雖然深度學習有著無限的潛力,但它也不是萬金油,在它提供更通用和更有效的解決方案的同時,它在不同情景的使用依然需要大家經驗的積累和對問題的思考。雖然依靠著現(xiàn)代強大的計算能力發(fā)光發(fā)熱,但現(xiàn)在的它更像個黑箱子。背后的原理需要大家共同努力發(fā)現(xiàn)。

  隨著人工智能的大熱,深度學習技術也隨之走到人們的事業(yè)之前,雖然深度學習有著無限的潛力,但它也不是萬金油,在它提供更通用和更有效的解決方案的同時,它在不同情景的使用依然需要大家經驗的積累和對問題的思考。雖然依靠著現(xiàn)代強大的計算能力發(fā)光發(fā)熱,但現(xiàn)在的它更像個黑箱子。背后的原理需要大家共同努力發(fā)現(xiàn)。

  2016年科技領域最火的是什么?那必須是虛擬現(xiàn)實(VR)與人工智能(AI)了,不久前的“人機大戰(zhàn)”引發(fā)了全民熱議,阿法狗也將深度學習神經網(wǎng)絡即DNN的強大能力展示在了人們面前。

  而此時,中國科學院計算技術研究所也發(fā)布了全球首個能夠“深度學習”的“神經網(wǎng)絡”處理器芯片,名為“寒武紀”。這項技術在不久的未來,反欺詐的刷臉支付、圖片搜索等都將更加可靠、易用。

  深度學習技術的逐漸的成熟與商用,也使得人工智能的更加一步步的貼近消費者的日常生活,那么,深度學習技術到底有什么魔力呢?

  深度學習有多深?學了究竟有幾分?

  深度學習其實是神經網(wǎng)絡的品牌重塑。一提到神經網(wǎng)絡,我們很容易聯(lián)想到腦瓜里的千絲萬縷。的確,神經網(wǎng)絡(Neural Network)模型在發(fā)明之初是從人腦神經元這個概念得到靈感。首先我們看一個單一的神經元模型。

  神經網(wǎng)絡沒有一個嚴格的正式定義。它的基本特點,是試圖模仿大腦的神經元之間傳遞,處理信息的模式。

 

  一個計算模型,要劃分為神經網(wǎng)絡,通常需要大量彼此連接的節(jié)點 (也稱 ‘神經元’),并且具備兩個特性:

  每個神經元,通過某種特定的輸出函數(shù) (也叫激勵函數(shù) activation function),計算處理來自其它相鄰神經元的加權輸入值

  神經元之間的信息傳遞的強度,用所謂加權值來定義,算法會不斷自我學習,調整這個加權值

  在此基礎上,神經網(wǎng)絡的計算模型,依靠大量的數(shù)據(jù)來訓練,還需要:

  成本函數(shù) (cost function):用來定量評估根據(jù)特定輸入值, 計算出來的輸出結果,離正確值有多遠,結果有多靠譜

  學習的算法 ( learning algorithm ):這是根據(jù)成本函數(shù)的結果, 自學, 糾錯, 最快地找到神經元之間最優(yōu)化的加權值

  用小明、小紅和隔壁老王們都可以聽懂的語言來解釋,神經網(wǎng)絡算法的核心就是:計算、連接、評估、糾錯、瘋狂培訓。

  隨著神經網(wǎng)絡研究的不斷變遷,其計算特點和傳統(tǒng)的生物神經元的連接模型漸漸脫鉤。

  但是它保留的精髓是:非線性、分布式、并行計算、自適應、自組織。

  深度學習技術應用前景廣泛

  目前為止,人工智能商業(yè)化的主要方向主要包含以下幾個方面的內容:自然語言處理(包括語音和語義識別、自動翻譯)、計算機視覺(圖像識別)、知識表示、機器與機器人學。這些AI的深度學習技術主要的應用場景有搜索、移動支付、機器人、智能硬件、智能醫(yī)療、智能汽車、虛擬現(xiàn)實等。

  虛擬現(xiàn)實

  那么如此炫酷的深度學習能否應用在大熱的VR行業(yè)?答案是肯定的。目前VR領域中應用到深度學習技術的包括語音識別、手勢識別等方面。

  眾所周知,VR行業(yè)面臨的一大技術難題就是海量數(shù)據(jù)的處理,以手勢識別技術為例,手部有非常多的關節(jié),需要非常強的識別能力才可以準確的識別每個精細動作。而深度學習模型的多隱藏層結構使得模型能有效利用海量數(shù)據(jù)進行訓練,所使用數(shù)據(jù)越多模型性能越高,非常適合在VR環(huán)境下做手勢識別。

  基于深度學習算法的思想實現(xiàn)的VR產品,并使用單機GPU方法來加速深度網(wǎng)絡的訓練和識別工作。手勢識別模組可以使用深度攝像頭實現(xiàn)手部近距離3D成像,結合深度學習自主研發(fā)了一套數(shù)據(jù)處理算法,實現(xiàn)了高精度實時手部動作識別,既能跟蹤單個手指,識別每個手指細微的動作,也可擴展至跟蹤多只手。

  這樣的VR產品的手勢識別具有捕捉精度高,響應速度快,靈敏度高,可以不受環(huán)境光線強弱影響,室內室外都可以使用。

  安防領域

  在安防領域,深度學習技術主要應用于監(jiān)控攝像機,因為行業(yè)領域對車牌識別、人臉識別、軌跡行為等智能分析的需求逐漸加大,使得很多從事智能分析的初創(chuàng)公司進入安防領域,通過合作或者純技術支持的方式,讓安防智能分析業(yè)務在大數(shù)據(jù)、云計算等技術框架下,不僅解決了用戶對監(jiān)控的基本需求,還能給用戶提供數(shù)據(jù)報表、數(shù)據(jù)分析等附加值高的需求,并且在解決復雜場景人臉識別、不同監(jiān)控畫面準確識別同一人物等領域表現(xiàn)出誘人的應用前景,給公安、交通等執(zhí)法部門在業(yè)務上帶來極高的效率。

  深度學習技術在安防的應用,當前也主要是以某個“技術奇點”進入到攝像機中,這個過程更像是監(jiān)控攝像機的“智能大腦”在進行模塊化的組合,相信在未來不同的交叉技術之間的相互融合會產生更良好的化學反應。

  機器人

  傳統(tǒng)人工智能的機器學習是通過標記數(shù)據(jù)進行有監(jiān)督學習,隨著其所需處理數(shù)據(jù)量的增大,外界對其的支持和幫助也就更大,而且計算結果的準確性也會受到影響。因此,對于這種傳統(tǒng)算法,越來越多的數(shù)據(jù)將成為負擔,也更容易達到極限或產生錯誤結果。但深度學習是從未經標記的數(shù)據(jù)展開學習,這更接近人腦的學習方式,可以通過訓練之后自行掌握概念。面對海量數(shù)據(jù),深度學習算法可以做到傳統(tǒng)人工智能算法無法做到的事情,而且輸出結果會隨著數(shù)據(jù)處理量的增大而更加準確。

  深度學習賜予了機器人更高的“智商”,這將使得機器人不僅僅是智能干一些蠻力活,也能應用與對智能有更高要求的領域,比如說醫(yī)療行業(yè),因為具有意識的機器人能更好的了解人類的感受,從而對病人進行更好護理。歐盟發(fā)布了Robo Earth項目,四個機器人在模擬醫(yī)院的環(huán)境中相互協(xié)作來照顧病人,它們通過與云端服務器的交互來進行信息共享和互相學習。例如,一個機器人可以對醫(yī)院房間進行掃描并將完成的地圖上傳至Robo Earth,而另外一個對這個房間完全不了解的機器人就可以通過訪問云端的這張地圖來找到房間中一杯水,而不需要再進行額外的搜索。

  自動駕駛

  自動駕駛領域因為其高危險屬性便對相關技術的實時性與準確性提出了更高的要求,深度學習技術很好的契合了自動駕駛的這種需求。目前低成本攝影機和感應器讓車輛可以接受海量信息,通過深度學習,自動駕駛的智能控制系統(tǒng)利用神經網(wǎng)絡建立的模型,最終掌握人類駕駛的習慣。

  智能控制系統(tǒng)能夠迅速梳理出有用的信息,像是辨別各種車輛、區(qū)分警車和出租車、救護車和貨車,或是準備上路的汽車,甚至還能找出人行道上的自行車和心不在焉的行人。

  深度學習未來九大趨勢

  任何技術都處于不斷的進步與發(fā)展,深度學習目前所展現(xiàn)在人們面前的還只是其商用化的雛形,雖然已經很驚艷,但也存在諸多的問題,比如:算法經常停止于局部最優(yōu)解,而不是全球最優(yōu)解。這好比“只見樹木,不見森林”;算法的培訓,時間過長時,會出現(xiàn)過度擬合 (overfit),把噪音當做有效信號等缺陷與不足之處,那么未來的深度學習有哪些趨勢呢?

 

  神經網(wǎng)絡框架變得越來越復雜而精密

  在感知、語言翻譯等等方面的大部分最先進的神經網(wǎng)絡框架正在發(fā)展并且不在僅僅關于簡單前饋式(feed forward)框架或者卷積式框架(convolutional)。特別地,它們正在混合并匹配不同的神經網(wǎng)絡技術如LSTMs、卷積、自定義目標函數(shù)、多皮層柱(multiple cortical columns)等等。

  所有最酷的系統(tǒng)都在使用 LSTMs

  大部分最先進的系統(tǒng)都將LSTMs納入到系統(tǒng)中,以使系統(tǒng)具有捕捉重復模式的記憶力。

  “注意力模型”在升溫

  一些系統(tǒng),但不是全部,開始放到“注意力模型”的背景中,或者說讓神經網(wǎng)絡在完成任務的過程中試圖學習在哪里放置其“注意力”。這些還不是一個正規(guī)神經網(wǎng)絡流水線中的一部分,但是已經時不時的出現(xiàn)在模型中了。

  神經圖靈機仍然有趣,但并沒有影響到實際工作

  神經網(wǎng)絡圖靈機(Neural Turing Machines)的研究,或者說能夠有差異地訓練一個神經網(wǎng)絡來學習算法,仍然有趣,但是還沒有應用到實際工作中。它們還很復雜并且目前只能解決玩具問題(toy problems)。

  計算機視覺和自然語言處理,會變得幾乎不可分離——在電腦視覺和自然語言處理的領域的深度學習正在互相融合

  卷積神經網(wǎng)絡第一次出現(xiàn)是在電腦視覺中,但是現(xiàn)在用于一些自然語言處理(NLP)中了,LSTMs和主流對遞歸神經網(wǎng)絡使用的傾向性,第一次做出引人注目的成果是在NLP任務中——如序列到序列的翻譯(sequence-to-sequence translation),然而現(xiàn)在通過修剪被納入到電腦視覺神經網(wǎng)絡任務中。

  另外,電腦視覺和NLP的交叉部分再加上在如圖片捕捉任務中使用到的常見的嵌入(embeddings)技術,還很熱門。

  符號微分法越來越重要

  隨著神經網(wǎng)絡框架和它們的目標函數(shù)可以自定義,同時也變得越來越復雜,人為手動提取它們反向傳播中的梯度變得越來越難,也容易出錯。最新的工具包如谷歌的TensorFlow有了自動符號微分,所以你可以構建你的框架和目標函數(shù),在訓練過程中工具包會在眾多的碎片中自動地找出正確的微分來保證誤差梯度可以反向傳播。

  神經網(wǎng)絡模型壓縮帶來了越來越多令人驚喜的結果

  多個團隊展示了不同的方式來劇烈地壓縮一個訓練過的模型的權重數(shù)量:二值化(binarization)、固定浮點(fixed floating point)、迭代剪枝(iterative pruning)和微調措施(fine tuning steps)等等更多。

  這些方法為許多應用帶來了可能:有可能將很復雜的模型適配到手機上,例如,與云端無延遲的對話來得到結果,如語音識別。另外,如果我們能夠高幀率的快速查詢一個模型(因為它的空間和計算運行時間成本很低,如30 FPS),那么在移動裝置上使用復雜的、訓練好的神經網(wǎng)絡模型來完成接近實時的新類型電腦視覺任務就有可能了。

  NIPS展示了這些壓縮技術,但是我沒有看到任何人應用它們。我覺得我們在2016年可能見到相應的應用。

  深度學習和強化學習的交叉在繼續(xù)

  雖然今年NIPS沒有展示關于強化學習的主要結果,但是深度強化學習研究討論室只剩下站立的地方,他們展示了深度神經網(wǎng)絡和強化學習的計劃能力兩者結合給人帶來的令人興奮的可能。

  在這個領域一些令人興奮的工作正在發(fā)生,如端對端機器人,使用深度學習和強化學習來完成原始傳感器數(shù)據(jù)到實際動作執(zhí)行器的直接過度。我們正從過去的只是分類一步步發(fā)展到試圖理解如何在方程中加入計劃和行動。還有更多的工作要做,但是早期工作很令人興奮。

  神經網(wǎng)絡和產品應用,應該攜手同行

  你需要讓研究人員創(chuàng)造新的神經網(wǎng)絡方法,而且也有途徑將這些方法快速擴展到實際應用產品中。谷歌的TensorFlow是數(shù)據(jù)庫中很少做到這一點的平臺之一:研究人員可以快速創(chuàng)造新的網(wǎng)絡拓撲如圖像,然后這些能夠擴展在不同的配置中——如使用像Python或C++主流程序語言的單個設備、多個設備或者是移動設備中。

  然而,注意到TensorFlow還在早期階段;Caffe現(xiàn)在倒是能使用。TensorFlow的單裝置表現(xiàn)不如其他的構架;谷歌也宣稱不久他們會公布一個使用Kubernetes和gRPC的分布式版本但是分布式訓練尚未發(fā)揮作用;并且使用TensorFlow目前還不能在亞馬遜的AWS上運行。盡管如此,TensorFlow的前景可期。

人物訪談