科技公司的"軍備競賽":人工智能迎來大爆發(fā)
提起“人工智能”,人類似乎總會陷入某種過分的恐慌之中。去年10月,特斯拉公司CEO埃隆·馬斯克在美國麻省理工大學(xué)的一次演講中,將人工智能技術(shù)描述為“對魔鬼的召喚”。他說,研發(fā)出和人類智能勢均力敵的“人工智能”,可能是人類面臨的最大威脅。對于這點,馬斯克絕非在單打獨斗。哈佛大學(xué)的一位哲學(xué)家尼克·博斯特羅姆也把人工智能與全面核戰(zhàn)、巨型流星撞擊地球等一起列為巨型災(zāi)難,而他本人正是“生存風(fēng)險”這個概念的創(chuàng)始人之一。同時,劍橋大學(xué)“生存風(fēng)險”研究中心的創(chuàng)始人里斯勛爵也認(rèn)為,人工智能給人類帶來的生存威脅非常嚴(yán)重,而他曾經(jīng)執(zhí)掌英國最先進(jìn)的科學(xué)團(tuán)體—英國皇家學(xué)會。
人工智能的“軍備競賽”
不過,這些來自資深科技專家的深深憂慮,與人工智能這個領(lǐng)域內(nèi)部充斥的樂觀態(tài)度以及迅猛發(fā)展,形成了鮮明的反差。一些世界知名大公司,如谷歌、Facebook、亞馬遜、百度,甚至開始了一場關(guān)于人工智能的“軍備競賽”,他們爭先恐后地挖角科學(xué)家、建立實驗室、購買啟動設(shè)備??傮w看來,人工智能業(yè)內(nèi)人士并不擔(dān)心被自己的造物所超越。其實他們也并沒有創(chuàng)造什么新的“思維模式”,只是讓原本只能由人來做的事情能夠被機(jī)器所完成而已。
近年來,從計算機(jī)、平板電腦和手機(jī)上產(chǎn)生的圖文數(shù)據(jù)浩如煙海,但計算機(jī)還是可以運用強(qiáng)大的計算能力將這些數(shù)據(jù)擺平。這多少說明了一件事:現(xiàn)在的智能終端,處理語言和圖像是越來越在行了。在商家雇主留意到這一點的同時,很多擔(dān)心自己飯碗的人也注意到了這一點。如果計算機(jī)能夠辨認(rèn)圖像或翻譯語言,那么會引發(fā)兩種情況——要么促使智能計算機(jī)(或程序)的廣泛應(yīng)用,要么使得一小部分會用這些計算機(jī)程序的人類工作效率大大提高。無論哪種情況發(fā)生,結(jié)果都會使不少從事圖像或語言工作的白領(lǐng)們站到等待失業(yè)救濟(jì)的隊伍中去。
現(xiàn)在,人工智能大爆發(fā)的跡象仍然比比皆是。去年,業(yè)內(nèi)相傳谷歌為一個叫作“深思”的倫敦人工智能創(chuàng)業(yè)項目投入了4億美元,在Facebook的眼皮底下攫取了這個公司。而后者也在積極建立自己的人工智能實驗室。目前Facebook的實驗室由紐約大學(xué)的明星研究者雅恩·樂存領(lǐng)導(dǎo)。而谷歌曾經(jīng)雇傭的人工智能大師級科學(xué)家——來自斯坦福的安德魯則又被挖角到了百度在硅谷建立的人工智能公司。同時位于芝加哥的敘事科學(xué)公司、位于英國劍橋和美國麻省的肯碩公司也都沐浴在投資人的“錢雨”之中。敘事科學(xué)公司致力于用人工智能撰寫財經(jīng)報道(《福布斯》雜志現(xiàn)在已經(jīng)開始應(yīng)用這個發(fā)明),而肯碩公司則努力在開發(fā)一種能夠進(jìn)行數(shù)據(jù)投資分析的人工智能。今年4月,IBM公司也宣布他們要在一款智能計算機(jī)的基礎(chǔ)上,研發(fā)一種能夠分析健康報告并提出醫(yī)療建議的人工智能,而這個作為基礎(chǔ)的Watson智能計算機(jī),曾經(jīng)在2011年一場美國智力競賽中完敗兩名人類冠軍。
人工智能的關(guān)鍵:能夠深層思維
其實,對人工智能的研究幾乎是與對計算機(jī)的研究同時開始的。其中最令人興奮的部分被叫作“深層學(xué)習(xí)”,以前也稱“機(jī)器學(xué)習(xí)”,它指的是計算機(jī)通過大量運算教會自己學(xué)習(xí)的一種能力。這個問題困擾人工智能研究者也不是一年兩年了。通常,對人類來說很困難的東西對計算機(jī)來說卻很簡單,比如一秒鐘進(jìn)行多次復(fù)雜運算;而對人類來說很簡單的東西對計算機(jī)而言卻很難,比如聽懂一種語言或是辨認(rèn)圖像中的各種物體或人臉。
各種運算、計算機(jī)只需要建立公式和方程規(guī)則,然后開始按照它們解方程就好。而對于語言或者圖像,計算機(jī)就沒有那么多清晰的規(guī)律可循了。舉個例子,正常的成年人很容易從一堆電影里分辨出色情片和藝術(shù)片(即使它們同樣都有裸露鏡頭),而這其中大腦是怎么運轉(zhuǎn)的卻沒人說得清楚——這個事實是由美國高等法院大法官波特·斯圖亞特發(fā)現(xiàn)。這位可敬的法官在試圖對色情片進(jìn)行清晰定義時慘遭失敗,只好無奈地寫道:“我一看就知道這是個色情片!”
“機(jī)器學(xué)習(xí)”指的就是讓計算機(jī)學(xué)會這種它們不能給出清晰定義和規(guī)則的事情。做到這點也并非毫無可能,不過實在是需要非常非常巨量的數(shù)據(jù)運算。
為了解決這個問題,目前很多人工智能運用的是一種叫作“神經(jīng)網(wǎng)絡(luò)”的技術(shù)。這種用來進(jìn)行分析統(tǒng)計的技術(shù)雖然很有些年頭了,但其實非常有價值。早在1950年,研究者們就發(fā)明出了神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),那時他們還不知道“智能”為何物,不過能夠確定的是,人類的大腦也有這樣的結(jié)構(gòu)——人腦不是通過晶體管,而是通過神經(jīng)元進(jìn)行信息處理的。而神經(jīng)元是一種多觸手、高聯(lián)結(jié)的細(xì)胞,他們通過彼此來傳遞生物化學(xué)信號刺激——這可能就是某種智能活動的形成。
神經(jīng)聯(lián)網(wǎng)系統(tǒng)
然而,人類的神經(jīng)元細(xì)胞極其復(fù)雜,要想模仿談何容易。至今能用在人工智能中的信號刺激與人類神經(jīng)元之間傳遞的生物化學(xué)信號相比,簡直就是拙劣的卡通和真實世界的差距。但即使是最笨拙的模擬神經(jīng)網(wǎng)絡(luò)系統(tǒng),對某些任務(wù)來說也是相當(dāng)有益的。微軟的人工智能專家克里斯·畢曉普指出,早在1960年,電話公司就曾經(jīng)運用神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)來消除電話里的回音。不過,它需要的計算實在太多了,那時的計算能力限制了接受刺激信號的網(wǎng)絡(luò)范圍,從而限制了這種技術(shù)的發(fā)展。
最近幾年,由于要繪制電子視頻游戲中的圖像,電子芯片的計算能力被大大提高了,因此人們對神經(jīng)網(wǎng)絡(luò)系統(tǒng)的興趣得以回升。以前那種幾十個或幾百個神經(jīng)網(wǎng)絡(luò)系統(tǒng)被看作一個單層結(jié)構(gòu),而谷歌最新的研究成果中,能接受刺激的“神經(jīng)元”高達(dá)10億個左右。正因為有了大量仿制神經(jīng)元可供研究使用,科學(xué)家們可以將它們按照人類大腦的結(jié)構(gòu)聯(lián)結(jié)起來,造出多層、分層結(jié)構(gòu),而正是這樣的結(jié)構(gòu),帶來了計算機(jī)“深層學(xué)習(xí)”的能力。
這種神經(jīng)聯(lián)網(wǎng)的每一層都擔(dān)負(fù)著不同的任務(wù)。以人臉圖像處理的過程為例——
第一層主要處理原始圖像,它會注意到圖像中每個像素的亮度、顏色和它們在圖像中的分布情況;
第二層則會把第一層觀察到的東西用更抽象的方法歸類,分辨出圖像的邊緣、陰影等;
最后一層對圖像邊緣、陰影進(jìn)行逐一分析,識別出眼睛、鼻子、嘴唇等特征。——這樣就可以完成對任何一張面孔的識別了。
要想讓這種機(jī)制真正起作用,需要對計算機(jī)進(jìn)行訓(xùn)練。訓(xùn)練的方法是讓計算機(jī)處理大量的圖像,這些圖像中有的是人臉,有的不是。計算機(jī)的任務(wù)是將其中的人臉圖像分辨出來,這就需要它自己來給自己設(shè)定一定的程序,在統(tǒng)計規(guī)則中找出人臉的抽象共性。如果它處理真實世界的人臉圖像沒有什么問題,就說明訓(xùn)練成功了。人聲識別系統(tǒng)的訓(xùn)練也是同理。
要做到這一點,“深層學(xué)習(xí)”的算法需要努力去學(xué)習(xí)這些人類的技能,但是這其間還是需要人類幫助的介入。例如,在輸入圖像初期,人類要注明哪些是人臉,哪些不是,好讓計算機(jī)能有個大概的印象。早期的計算機(jī)的“教材”會受到數(shù)據(jù)量的限制,但互聯(lián)網(wǎng)的存在使得這個限制消失了——百度、谷歌和Facebook上面有著無窮無盡的圖像資源,而且上傳者還會對這些照片和圖像加標(biāo)簽、作評論?!奥斆鳌钡挠嬎銠C(jī)會從這些海量的“教材”和“注釋”中總結(jié)出模式、規(guī)律和范疇。
因此,計算機(jī)交出的答卷相當(dāng)令人驚嘆。2014年,F(xiàn)acebook公布了一款名為“深度面孔”的算法,這個算法可以成功辨認(rèn)出網(wǎng)絡(luò)上97%的真實人臉圖像,即使有些照片中人臉被遮住了一半或是光線很暗。這基本上已經(jīng)達(dá)到了人類對面部的辨識能力水平。而微軟也在炫耀自己為科塔娜(一款數(shù)碼個人協(xié)助軟件)開發(fā)的高精度識別算法——這個算法能夠分辨出極其相似的彭布洛克威爾士科基犬和卡迪根威爾士柯基犬。所以,目前這種技術(shù)已經(jīng)相當(dāng)成熟,包括英國在內(nèi)的一些國家已經(jīng)在應(yīng)用人臉識別系統(tǒng)處理邊境事務(wù)了。另外,除了圖像,從視頻和音頻中識別出人類跡象的技術(shù),對警察和間諜來說也有著無法抗拒的吸引力。今年5月5日的一份官方報告中顯示,美國警察已經(jīng)可以應(yīng)用某種程序把電話錄音轉(zhuǎn)成文字,使得其中的某些信息更易在網(wǎng)上搜尋。
圖像識別是最基本最重要的能力
然而,互聯(lián)網(wǎng)上帶著標(biāo)簽的照片盡管數(shù)量浩大,但也是有限的,人工智能的下一步是讓計算機(jī)掌握“無人監(jiān)控和幫助”的學(xué)習(xí)。谷歌團(tuán)隊的安德魯博士已經(jīng)開發(fā)出了這種成果:它的計算機(jī)可以在數(shù)以億計youtube視頻中分辨出人臉和貓臉,而這些視頻并沒有任何的標(biāo)簽或名稱。經(jīng)過一段時間的分析,計算機(jī)也能自己找出規(guī)律并完美地完成這個任務(wù)。
更進(jìn)一步的嘗試,是在一幅復(fù)雜的圖像中分辨出不同的組成部分。斯坦福大學(xué)的一篇論文中已經(jīng)表明,某種計算機(jī)程序已經(jīng)可以把一張早餐桌的照片中每種東西都分辨出來并用英語標(biāo)注,如紅色的花、香蕉片或是一杯水等。
大型互聯(lián)網(wǎng)公司熱衷于人工智能的開發(fā),主要是因為這項技術(shù)對他們來說利益攸關(guān)。短期來看,計算機(jī)算法對圖像、聲音的分辨能力越高,客戶查找搜索的時候就會越方便;從長遠(yuǎn)來看,這項技術(shù)對智能機(jī)器人的發(fā)明意義十分重大,從自動駕駛汽車到戰(zhàn)場作戰(zhàn)機(jī)器人,在紛繁的真實世界識別圖像都是最重要也是最基本的能力。
圖像分辨技術(shù)也可以應(yīng)用到現(xiàn)實的領(lǐng)域中去,谷歌眼鏡和微軟全息眼鏡已經(jīng)開始使用這種技術(shù)了。美國舊金山的Enlitic公司也在嘗試用計算機(jī)圖像識別技術(shù)來支持X光和核磁共振圖像,這樣有可能發(fā)現(xiàn)一些醫(yī)生肉眼錯過的異常情況。
其實,深層學(xué)習(xí)能力不僅僅體現(xiàn)在圖像識別方面,任何一種需要大量接觸數(shù)據(jù)的領(lǐng)域都有它的用武之地,不管是運營保險公司還是從事遺傳學(xué)研究。在世界上最大的粒子實驗室CERN實驗室中,人們還真發(fā)現(xiàn)了人工智能深層學(xué)習(xí)的妙處——一個能夠深層學(xué)習(xí)的計算機(jī)自己寫了一套程序來識別亞原子粒子,它的程序居然比物理學(xué)家們自己編寫的程序更加有效。另外,一些研究者做了個會玩電子游戲的程序,這個程序玩起“太空入侵者”來居然超過了這些人類玩家。
并非機(jī)械中的鬼魂
更好的智能手機(jī)、更精密的機(jī)器人和更方便的網(wǎng)絡(luò),對世界來說無疑是一種福音,但這些已經(jīng)學(xué)會了圖像語言識別和自編程序的機(jī)器人,是否會讓文章開頭中馬斯克的擔(dān)心成為現(xiàn)實呢?這些聰明能干的計算機(jī),是否超越了它的創(chuàng)造者的智商而邁出了重要、危險的一步呢?
這些“機(jī)器人末世論者”其實有一個很有力的論據(jù)握在手中——近年來對人類大腦的研究表明,人腦就是一架由正常細(xì)胞、正常原子構(gòu)成的機(jī)器而已,它也遵循著一切科學(xué)自然原理,也就是說,并沒有一種叫作“精神”的東西來推動大腦的運行。創(chuàng)造出一個人造機(jī)械大腦,也許只是外觀上有所不同而已,原則上是完全可能也完全可行的。
不過,原則上可行和現(xiàn)實中的應(yīng)用遠(yuǎn)不是一回事。波士頓的Rethink Robotics公司的一個人工智能科學(xué)家羅德尼·布魯克斯指出,最令人糾結(jié)的是人們怎樣理解“智能”這個詞。是的,現(xiàn)在的計算機(jī)對某些目標(biāo)的識別能力極其精確,讓人感覺毛骨悚然。但它們沒有目標(biāo)、沒有動機(jī),對自己的所作所為也沒有任何思考。在這些方面,人工智能并不比一張紙或一個天氣建模更加智能到哪里去。
其實,人工智能在運行中運用了很多非理性的方法,只不過產(chǎn)生的結(jié)果使得它們看起來像是有些“理性”而已。就像另一位人工智能先驅(qū)者埃德加·迪克斯特拉所說,人工智能只是看起來很厲害很復(fù)雜,“就像潛水艇看起來也很厲害很復(fù)雜,但它會思考嗎?”
另外還有一些例子可以輕易打消人們的疑慮。有研究者已經(jīng)發(fā)表論文來論證這些所謂高智能的圖像分辨計算機(jī)是多么容易被人們愚弄,在沒有任何提示和任何背景提供信息時,這些智能軟件的答案往往令人啼笑皆非。研究者甚至可以制造出在人看來就是一團(tuán)隨便涂鴉的圖像,但這些圖像有某種誤導(dǎo)智能軟件的能力,所以智能軟件往往把它們錯誤地識別成一種具體的東西。
不過,新技術(shù)的誕生總會影響到工作機(jī)會。也許在將來,人們的智能手機(jī)的計算能力就可以頂?shù)蒙犀F(xiàn)在一座城中所有電腦的總和,那時人們不需要翻譯也不需要體檢醫(yī)生,一切相關(guān)服務(wù)都在他們的口袋里。而人們?yōu)榇怂冻龅?,只是一塊手機(jī)電池的費用而已。
總之,更加智能的計算機(jī)絕對是一種革命性的技術(shù),但絕不是馬斯克先生和里斯勛爵所擔(dān)心的那一種。當(dāng)然,也許在遙遠(yuǎn)的未來,會有機(jī)器合成帶有人類性格的仿真大腦,但是在那一天到來之前,還是先擔(dān)心一下自己的工作會不會被眼前的人工智能搶走來得比較現(xiàn)實。