百度人工智能技術(shù)研發(fā)獲重大突破 谷歌微軟競相借鑒
此前外媒報道稱谷歌已經(jīng)基本掌握“讓電腦用人類自然語言描述圖片內(nèi)容”這一人工智能領(lǐng)域的最前沿技術(shù)。不過,近日斯坦福大學(xué)一位研究人員指出,真正最先在該技術(shù)上取得突破的,并非是谷歌,而是來自中國的百度。
事實的確如此。在谷歌、微軟以及多倫多大學(xué)在內(nèi)等多家企業(yè)及機(jī)構(gòu)各自公布的有關(guān)該項技術(shù)的最新研究成果中,均公開注明引用了百度研究院杰出科學(xué)家徐偉此前在該技術(shù)上的研究成果。
長期以來,電腦對于“文字”和“圖像”,一直采取不同類別的處理模式,然而要直接讓電腦透過一幅圖片立即迅速、準(zhǔn)確地給出對應(yīng)的一句文字解釋,幾乎是一件不可能的事情?!袄冒俣鹊纳疃葘W(xué)習(xí)能力,即一種靈感來自于人腦運行方式的人工智能技術(shù),百度成為世界上第一個解決這一技術(shù)難題的公司”, 百度研究院副院長,深度學(xué)習(xí)實驗室(IDL)主任余凱表示,“利用CNN(卷積神經(jīng)網(wǎng)絡(luò))和RNN(遞歸神經(jīng)網(wǎng)絡(luò))技術(shù),百度成功地實現(xiàn)將圖像內(nèi)容生成自然語言的描述性句子或段落,從而在高層語義層面建立了圖像和自然語言之間的橋梁,也就是“機(jī)器讀圖”,而這可以說是人工智能領(lǐng)域的一次技術(shù)飛躍?!?/P>
據(jù)介紹,百度的這一項目,由百度研究院杰出科學(xué)家徐偉主導(dǎo)的團(tuán)隊,毛俊華、楊億,王江等人研發(fā),其研究成果的相關(guān)論文于2014年10月份公布于arXiv。隨后,包括谷歌、微軟等多家知名公司和諸如多倫多大學(xué)等一批致力于該技術(shù)研究的機(jī)構(gòu),相繼公布各自的研究成果——無一例外,在研究報告或者論文中,均引用了該論文?!鞍俣仍谌斯ぶ悄茴I(lǐng)域的投資力度一直很大,我們的突破既得益于公司整體戰(zhàn)略的支持,也離不開整個團(tuán)隊日日夜夜的奮斗”,徐偉表示,“百度深度學(xué)習(xí)研究院為人工智能技術(shù)的發(fā)展提供了得天獨厚的條件和資源,而且百度始終有著一個開放的技術(shù)心態(tài)”。
圖注:百度研發(fā)的“機(jī)器讀圖”技術(shù),能夠幫助計算機(jī)根據(jù)圖片內(nèi)容自動生成一段描述文字
據(jù)悉,這項技術(shù)突破,一方面有巨大的應(yīng)用空間,比如讓用戶通過自然語言找到需要的圖片或視頻,結(jié)合Baidu Eye幫助盲人了解周圍環(huán)境,幫助兒童學(xué)習(xí)語言等。另一方面在人工智能的發(fā)展上有重要的意義。因為這個技術(shù)把傳統(tǒng)上人工智能的兩大分支- 自然語言處理和計算機(jī)視覺無縫地連為一體,從而使計算機(jī)能夠真正地學(xué)習(xí)和建立語言和所感知到的物理世界之間的聯(lián)系,這對于解決長期困擾人工智能的難題“常識推理”(common sense reasoning)是重要的一步。
人工智能技術(shù)屬于當(dāng)前互聯(lián)網(wǎng)領(lǐng)域技術(shù)研發(fā)的最前沿。簡單而言,可以將之理解為一種幫助計算機(jī)理解語音、圖像以及文字內(nèi)容的智能技術(shù)。近些年,全球互聯(lián)網(wǎng)領(lǐng)域的幾大巨頭——谷歌、微軟、蘋果和Facebook等都在積極進(jìn)行人工智能方面的研發(fā),以改進(jìn)其在圖像、視頻及語音的信息處理方面提供服務(wù)的能力。比如,谷歌一連收購8家機(jī)器人公司,蘋果則表示在計算機(jī)視覺、機(jī)器學(xué)習(xí)、以及算法編寫等領(lǐng)域存在大量的職位空缺——在一定程度上,人工智能技術(shù)被認(rèn)為是互聯(lián)網(wǎng)產(chǎn)業(yè)的下一個“引爆點”。
很顯然,百度注意到了這一互聯(lián)網(wǎng)發(fā)展的大趨勢,并迅速對此展開了積極而全面的布局。2014年5月,有著“谷歌大腦之父”的深度學(xué)習(xí)專家吳恩達(dá)加盟百度,任職百度首席科學(xué)家。隨即,百度宣布未來5年內(nèi)將對其深度學(xué)習(xí)實驗室投資3億美元。2014年9月,另一位重量級技術(shù)人才——前微軟全球資深副總裁張亞勤亦正式加盟百度,任職百度總裁并全面負(fù)責(zé)新興業(yè)務(wù)。技術(shù)出身的張亞勤在大數(shù)據(jù)、云計算等技術(shù)創(chuàng)新方面與百度未來戰(zhàn)略不謀而合。
2014年9月25日,美國知名高科技網(wǎng)站Xconomay的一篇介紹性報道指出,諸多“事實和數(shù)據(jù)”顯示,來自中國的搜索巨頭百度,正在成長為全球人工智能領(lǐng)域的領(lǐng)袖型企業(yè)之一。
“我們需要有這種信心,甚至對我來講是一種信仰:就是對于技術(shù)的投資會獲得回報,而且不僅僅是給百度帶來回報,更會給整個社會帶來非常大的回報?!?在2014年11月于浙江義烏古鎮(zhèn)舉行的世界互聯(lián)網(wǎng)大會上,百度公司創(chuàng)始人、董事長兼CEO李彥宏如此表示。而根據(jù)李彥宏的透露,百度正持續(xù)投入大筆資金用于人工智能研究。
“有一天電腦會比人腦聰明。對于自然語言的理解、模式的識別、計算機(jī)的視覺這些聽起來很遙遠(yuǎn)的事情,其實很快可以實現(xiàn)?!崩顝┖暾f:“技術(shù)的積累是從量變到質(zhì)變的過程,量變的過程我們經(jīng)常忽略,質(zhì)變發(fā)生時我們又經(jīng)常被打得措手不及。而對于即將到來的質(zhì)變,我希望百度能有所貢獻(xiàn)?!?/P>