影音先锋熟女少妇av资源,国产精品52页,2021精品国产自在现线看,亚洲高清中文字幕在线

物聯(lián)傳媒 旗下網(wǎng)站
登錄 注冊(cè)

谷歌人工智能背后的大腦:最快15年實(shí)現(xiàn)通用人工智能

作者:本站采編
來(lái)源:機(jī)器之心
日期:2016-08-03 10:07:03
摘要:Jeff Dean 描述了他在谷歌的多種角色、該公司的人工智能愿景、他對(duì)谷歌作為科技巨頭的同時(shí)又如何保持創(chuàng)業(yè)精神上的想法等眾多主題。

  Jeff Dean 在獲得華盛頓大學(xué)計(jì)算機(jī)科學(xué)博士學(xué)位的三年之后(1999 年)加入了谷歌公司,成為了該公司最早的員工之一。在谷歌的成長(zhǎng)過(guò)程中,他一直是該公司的頭面人物——設(shè)計(jì)和實(shí)現(xiàn)了支撐谷歌大部分產(chǎn)品的許多分布式計(jì)算基礎(chǔ)設(shè)施。

  谷歌 CEO Sundar Pichai 曾說(shuō)過(guò)谷歌將會(huì)變成一家人工智能優(yōu)先的公司;作為系統(tǒng)和基礎(chǔ)設(shè)施組(Systems and Infrastructure Group)的高級(jí)成員,Dean 及其團(tuán)隊(duì)對(duì)實(shí)現(xiàn)這樣的目標(biāo)至關(guān)重要。在這個(gè)涉及范圍廣泛的訪談中,Dean 描述了他在谷歌的多種角色、該公司的人工智能愿景、他對(duì)谷歌如何在作為科技巨頭的同時(shí)保持創(chuàng)業(yè)精神的想法,以及其它許多主題。

  Peter High:Jeff Dean,你 1999 年加入谷歌,見(jiàn)證了該公司大部分歷史。請(qǐng)給我們簡(jiǎn)要描述一下你這 17 年來(lái)在該公司所扮演的角色的發(fā)展。

  Jeff Dean:當(dāng)我加入的時(shí)候,谷歌還相當(dāng)小。我們都擠在帕洛阿爾托大學(xué)路(University Avenue)上的一間小辦公司里。我的第一個(gè)主要工作是創(chuàng)建我們的第一個(gè)廣告系統(tǒng)。然后我用了四五年的時(shí)間來(lái)開(kāi)發(fā)在谷歌上的每次查詢都會(huì)用到的檢索、索引和搜索系統(tǒng)。在那之后,我基本上在和 Sanjay Ghemawat 等一些同事一起開(kāi)發(fā)谷歌用來(lái)存儲(chǔ)和處理大型數(shù)據(jù)集與做構(gòu)建搜索索引或處理衛(wèi)星圖像等事情的軟件基礎(chǔ)設(shè)施。最近一段時(shí)間,我一直在開(kāi)發(fā)研究機(jī)器學(xué)習(xí)系統(tǒng)。

  High:鑒于你的涉及范圍和角色是如此地廣泛,我想你可能沒(méi)有「平常的一天(average day)」。你如何確定與公司內(nèi)外的什么人進(jìn)行交流?我很想知道你如何在你所從事的不同事情上分配時(shí)間。

  Dean:我沒(méi)什么典型的一天。在開(kāi)始的十四或十五年里,我沒(méi)有任何管理上的工作,那給了我更多自由時(shí)間來(lái)專注編寫代碼。過(guò)去幾年,我管理了一些機(jī)器學(xué)習(xí)上的工作,這對(duì)我來(lái)說(shuō)是一件有趣而新穎的學(xué)習(xí)經(jīng)歷。因?yàn)槲以谠摴镜倪@段歷史里做過(guò)很多事情,而且我喜歡這些不同的項(xiàng)目進(jìn)展保持關(guān)注,我常常收到很多郵件。我在處理電子郵件上花了很多時(shí)間,大部分是刪除或略讀它們以了解事情的進(jìn)展。在任何時(shí)候,我都有幾個(gè)技術(shù)項(xiàng)目要做,所以我需要在各種會(huì)議和設(shè)計(jì)審查這些事情之中找到花費(fèi)我每天時(shí)間的方法。

  High:盡管谷歌實(shí)現(xiàn)了急速的成長(zhǎng),但谷歌一直是創(chuàng)新的典范。它的雄心和創(chuàng)新精神看起來(lái)就好像它還是一家小公司一樣,但它現(xiàn)在已經(jīng)擁有了人力和財(cái)力上的資源,是科技行業(yè)的龐然大物。谷歌這家企業(yè)是如何打敗繁文縟節(jié)和官僚主義,從而使其保持與其體量不相稱的靈活性的?

  Dean:自我加入公司以來(lái),谷歌基本上就一直在不斷成長(zhǎng)。早些年的時(shí)候,我們的員工數(shù)量每年都在翻番。在百分比上,我們現(xiàn)在已經(jīng)放緩了;但在絕對(duì)數(shù)量上,我們?nèi)匀挥邢喈?dāng)顯著的增長(zhǎng),員工的數(shù)量每年都會(huì)增長(zhǎng)大概 10% 到 20% 的樣子。公司體量的每一次倍增都會(huì)迫使我們重新思考該在公司內(nèi)部如何完成事情。在 X 人時(shí)有效的做法,人數(shù)擴(kuò)增到兩倍時(shí)已經(jīng)行不通了,我們必須搞清楚如何適應(yīng)我們的風(fēng)格、我們的工程開(kāi)發(fā)、組織架構(gòu)、團(tuán)隊(duì)動(dòng)態(tài)等等以適應(yīng)新的公司規(guī)模。

  我認(rèn)為在增長(zhǎng)中對(duì)我們有所助益的一件事情是我們往往會(huì)分支到許多不同的領(lǐng)域,這些領(lǐng)域在某種程度上獨(dú)立于谷歌的其它部門的工作。創(chuàng)造用于接入互聯(lián)網(wǎng)的高空氣球的部門與提供搜索查詢的部門只有相對(duì)適中的互動(dòng)。和我們核心業(yè)務(wù)中的項(xiàng)目不一樣,我們?cè)S多不同活躍項(xiàng)目都不需要那么多的交流,這讓我們可以實(shí)現(xiàn)規(guī)模和效率。

  High:我理解谷歌/Alphabet 分離的部分原因是因?yàn)橐獙⒉煌愋偷幕顒?dòng)分開(kāi)以保持敏捷。這是一個(gè)合理的評(píng)價(jià)嗎?

  Dean:我認(rèn)為是的。我認(rèn)為這能讓 Alphabet 旗下的其它實(shí)體能更獨(dú)立地運(yùn)作。對(duì)于規(guī)模的倍增,我想說(shuō)通過(guò)一些有趣的轉(zhuǎn)變,我們從所有人都在一個(gè)建筑里工作變成了現(xiàn)在不再同一個(gè)建筑里。

  后來(lái),我們的工程開(kāi)發(fā)工作也從山景城擴(kuò)散到了蘇黎世、紐約、東京和西雅圖。我們這五處辦公室已經(jīng)有一段時(shí)間了,而且這些辦公室現(xiàn)在已經(jīng)發(fā)展得相當(dāng)大了。再后來(lái),在短短幾年之內(nèi),我們工程開(kāi)發(fā)的辦公室數(shù)量就從五個(gè)增加到了三十五個(gè),因?yàn)槲覀冇X(jué)得在世界各地尋找優(yōu)秀人才并圍繞他們開(kāi)設(shè)辦公室是非常好的。這讓我們不得不重新思考我們?cè)撊绾稳ソM織大量的工程開(kāi)發(fā)工作。如果你有一個(gè)小辦公室,它就可能不應(yīng)該做一百件事;它應(yīng)該只做少數(shù)幾件事,并專心將它們做好。一些小公司采用的模式是看山景城的其他人怎么做,他們看到別人正在做一百件事,所以他們認(rèn)為自己也應(yīng)該做一百件事。我們慢慢找到了一種使用分布在世界各地的工程辦公室中所有人的更好的方式。

  High:谷歌 CEO Sundar Pichai 曾經(jīng)說(shuō)過(guò),從長(zhǎng)遠(yuǎn)來(lái)看設(shè)備將逐漸消失,計(jì)算將從移動(dòng)優(yōu)先(mobile first )進(jìn)化到人工智能優(yōu)先(AI first)。請(qǐng)你描述一下谷歌的人工智能優(yōu)先的愿景。

  Dean:我認(rèn)為我們已經(jīng)從桌面計(jì)算移到了移動(dòng)計(jì)算,每個(gè)人都隨身帶有一個(gè)「計(jì)算設(shè)備」。隨著設(shè)備繼續(xù)縮小,語(yǔ)音識(shí)別和其它類型的可替代的用戶接口變得更實(shí)用,這將改變我們與計(jì)算設(shè)備交互的方式。它們可能隱入背后,并圍繞著我們,讓我們能夠像與可信賴的伴侶一樣和它們交流。它們將協(xié)助我們獲取想要的信息,或者幫助我們完成各種各樣的任務(wù)。我認(rèn)為這是向前推動(dòng)機(jī)器學(xué)習(xí)的一個(gè)主要目標(biāo):在提供建議上擁有能夠像人類伙伴那樣智慧的計(jì)算機(jī)、當(dāng)需要的時(shí)候它們能夠?qū)ふ业礁嗟男畔⒌冗@種事情。我認(rèn)為接下來(lái)五到十年將會(huì)是一段令人激動(dòng)的時(shí)間段。

  2016 年 5 月 18 日,谷歌 CEO Sundar Pichai 在谷歌 I/O 大會(huì)上發(fā)言

  High:因?yàn)槿〉昧艘恍┻M(jìn)展,人工智能的不同目的也完成了一些,看起來(lái)一些人不再將這些成就視為真正的人工智能。也就是,人工智能似乎總是以未來(lái)時(shí)的語(yǔ)氣在討論。你將如何定義人工智能的范圍呢?

  Dean:我認(rèn)為真正的通用人工智能是能夠表現(xiàn)出人類水平的推理、理解和完成復(fù)雜任務(wù)能力的系統(tǒng)。很明顯,我們還未達(dá)到這一步,但你說(shuō)已經(jīng)有了很多的進(jìn)展是正確的。 五年前,計(jì)算機(jī)接收一張圖片然后生成人類水平的語(yǔ)句描述圖片還是不可能的?,F(xiàn)在,一臺(tái)計(jì)算機(jī)生成的句子可能會(huì)說(shuō):「這張圖片是一個(gè)正拿著網(wǎng)球拍站在網(wǎng)球場(chǎng)上的男人?!雇瑫r(shí),一個(gè)人可能會(huì)說(shuō):「這張圖片是一個(gè)網(wǎng)球員正要發(fā)球?!谷祟惖拿枋龈鼮榫?xì),但事實(shí)上計(jì)算機(jī)已經(jīng)能夠產(chǎn)生看起來(lái)幾乎是人寫的描述語(yǔ)句,這已經(jīng)是一個(gè)相當(dāng)大的進(jìn)步了。在過(guò)去五六年中,隨著人們應(yīng)用的一些更為復(fù)雜的機(jī)器學(xué)習(xí)模型,我們?nèi)〉煤芏噙M(jìn)展,這只是其中的一個(gè)例子。因?yàn)樗麄兪褂酶蟮臄?shù)據(jù)集和更多的計(jì)算能力運(yùn)行這些模型,結(jié)果也已經(jīng)變得更好了。

  2016年 3 月,谷歌 DeepMind 挑戰(zhàn)賽上,韓國(guó)圍棋大師李世石與谷歌的人工智能程序 AlphaGo 對(duì)決

  High:你認(rèn)為我們離通用人工智能還有多遠(yuǎn)?

  Dean:這取決于你問(wèn)的是誰(shuí),不同的人會(huì)給出不同的估計(jì)。我不想妄加猜測(cè),只能給出一個(gè)寬泛的估計(jì)。我認(rèn)為我們還需要 15 到 50 年——可能接近這個(gè)范圍的更低的一端。

  High:你之前提到,語(yǔ)言是諸多關(guān)鍵要素中的一種,而且谷歌的許多人工智能計(jì)劃也是圍繞著語(yǔ)言,比如閱讀、理解網(wǎng)頁(yè)上的所有內(nèi)容或者智能化地交流和理解上下文語(yǔ)境。你能談一下讓機(jī)器更好地理解語(yǔ)言的途徑嗎?為了邁向(如果尚未完成)通用人工智能,你預(yù)見(jiàn)的發(fā)展道路是怎樣的?你在這方面做著哪些工作?

  Dean:我認(rèn)為一件有趣的事是信息檢索領(lǐng)域,這是谷歌早期工作的基礎(chǔ)。傳統(tǒng)上看,這并沒(méi)有試圖真正理解用戶在點(diǎn)擊搜索時(shí)到底想要什么。它更像是查找包含用戶所輸入詞的文件或意思接近這些單詞的內(nèi)容。有趣的是,在最近的四五年里,我們已經(jīng)開(kāi)始研發(fā)出可以更好地理解「車」這個(gè)詞的本質(zhì)的技術(shù)。知道「一輛車( car )」、「一些車( cars )」、「汽車( automobile )」、「客車( passenger car )」和「小型運(yùn)貨車(pickup truck )」在某種意義上是相關(guān)的,而且能以這種更流利的方式匹配文件,促成了在許多語(yǔ)言理解任務(wù)中的更好表現(xiàn)。

  我們不僅能理解詞匯,還能抓住要點(diǎn),理解兩個(gè)相互釋義的句子在某種意義上有相同的意思。機(jī)器開(kāi)始達(dá)到我們?nèi)祟惱斫庹Z(yǔ)言的水平,我們將能夠以更多機(jī)器學(xué)習(xí)的方式推動(dòng)機(jī)器理解更長(zhǎng)篇幅的文本。

  接下來(lái)幾年我們的目標(biāo)是讓機(jī)器系統(tǒng)吸收成百上千份文件,然后能談?wù)撐募锏膬?nèi)容。也許系統(tǒng)將總結(jié)這些文件,針對(duì)文件內(nèi)容提出或者回答問(wèn)題。我認(rèn)為這就是要真正表現(xiàn)出高水平語(yǔ)言理解所需的理解水平。

  High:你和你的團(tuán)隊(duì)取得的一些進(jìn)展似乎已經(jīng)用于谷歌的各種產(chǎn)品:谷歌助理——谷歌新的虛擬語(yǔ)音助手;Google Home——你們對(duì)亞馬遜 Echo 的回應(yīng);還有 Allo ——一款提供獲取谷歌服務(wù)的對(duì)話接口的消息應(yīng)用 。你怎么看待這些最近發(fā)布的新產(chǎn)品和谷歌內(nèi)部的試用產(chǎn)品?

  Dean:我那時(shí)領(lǐng)導(dǎo)的研究團(tuán)隊(duì)叫做谷歌大腦(Google Brain)。我們專注于構(gòu)建大規(guī)模的機(jī)器學(xué)習(xí)計(jì)算系統(tǒng)和研究高級(jí)的機(jī)器學(xué)習(xí)技術(shù)。有這兩種不同技能的人們聚集在一起共同解決難題,取得了明顯的進(jìn)步,而只具有機(jī)器學(xué)習(xí)技能或大規(guī)模計(jì)算技能的人通常不能獨(dú)自獲此成就。在我們能將這些問(wèn)題在多大程度上扔給計(jì)算機(jī)程序和我們?nèi)绾斡?xùn)練出強(qiáng)大的模型解決我們關(guān)心的問(wèn)題上,我認(rèn)為這是讓我們團(tuán)隊(duì)在兩個(gè)領(lǐng)域內(nèi)都取得相當(dāng)大的成功并推動(dòng)了技術(shù)向前發(fā)展的其中一個(gè)原因。

  在做長(zhǎng)期研究時(shí)我們一直是相當(dāng)機(jī)會(huì)主義的,我們懂得什么時(shí)候我們的一些研究成果可以用于改善谷歌現(xiàn)在的產(chǎn)品。我們將和產(chǎn)品團(tuán)隊(duì)一起工作,我們會(huì)說(shuō):「嘿,我們認(rèn)為這項(xiàng)機(jī)器學(xué)習(xí)研究在你的產(chǎn)品中是有用的?!褂袝r(shí)這是一個(gè)完全不能干涉的事情。而有時(shí)我們這個(gè)團(tuán)隊(duì)和產(chǎn)品團(tuán)隊(duì)又會(huì)深度合作,讓研究成果在產(chǎn)品中實(shí)現(xiàn)其價(jià)值。

  我們團(tuán)隊(duì)中的一些研究人員開(kāi)發(fā)了一個(gè)模型,叫「序列到序列學(xué)習(xí)(sequence-to-sequence learning)」。這個(gè)模型的核心想法是你用一個(gè)輸入序列來(lái)預(yù)測(cè)某些輸出結(jié)果序列。聽(tīng)起來(lái)有點(diǎn)抽象,但可以映射到許多你想要解決的真正問(wèn)題。他們發(fā)表的這個(gè)研究論文最初是語(yǔ)言翻譯背景下的應(yīng)用。輸入序列可以是一個(gè)句子的英文單詞,一次一個(gè)。該模型被訓(xùn)練去輸出對(duì)應(yīng)的法國(guó)單詞來(lái)創(chuàng)建一個(gè)法語(yǔ)句子,意思與輸入的英語(yǔ)句子相同。這不同于其他機(jī)器翻譯系統(tǒng),別的機(jī)器翻譯系統(tǒng)往往是代碼和子件(sub-piece)的問(wèn)題——也許使用了機(jī)器學(xué)習(xí)或統(tǒng)計(jì)模型將它拼接在一起。相比之下,這個(gè)系統(tǒng)是一個(gè)完全的機(jī)器學(xué)習(xí)的端到端系統(tǒng),在這個(gè)系統(tǒng)中你投進(jìn)成對(duì)的在不同語(yǔ)言中表達(dá)同一個(gè)意思的句子,然后系統(tǒng)就能學(xué)會(huì)將一種語(yǔ)言翻譯另一種語(yǔ)言。

  這個(gè)通用模型在其他環(huán)境中也很有用。Gmail 團(tuán)隊(duì)將它用作了一個(gè)名叫「智能回復(fù)」的功能的基礎(chǔ),這里面的輸入序列是一個(gè)傳入的電子郵件,生成序列是根據(jù)這個(gè)郵件的內(nèi)容預(yù)測(cè)出的可能回復(fù)。比如,你收到一封這樣的郵件:「嗨,我們想邀請(qǐng)你來(lái)吃感恩節(jié)晚餐。請(qǐng)告訴我們你能不能來(lái)?!惯@個(gè)生成的回復(fù)可能是「好的,我們會(huì)來(lái)。我們能帶點(diǎn)什么過(guò)來(lái)嗎?」或者是「對(duì)不起,我們來(lái)不了了,」或者是其他對(duì)應(yīng)語(yǔ)境的類似回復(fù)。用的是相同的基本模型,只是訓(xùn)練的數(shù)據(jù)集不同。

  High:谷歌大腦的這個(gè)研究在谷歌其他更多的傳統(tǒng)產(chǎn)品分支中有什么潛在的應(yīng)用和突破?

  Dean:我們已經(jīng)開(kāi)始將這個(gè)流程變得規(guī)范一點(diǎn)。五年前,當(dāng)我們最初創(chuàng)建機(jī)器學(xué)習(xí)研究團(tuán)隊(duì)以調(diào)查海量計(jì)算和深度神經(jīng)網(wǎng)絡(luò)如何解決問(wèn)題時(shí),公司里還沒(méi)有太多人使用這些方法。我們發(fā)現(xiàn)了一些用它們可以有效處理的領(lǐng)域,包括語(yǔ)音識(shí)別系統(tǒng),所以我們與語(yǔ)音識(shí)別團(tuán)隊(duì)的人密切協(xié)作,從而將深度神經(jīng)網(wǎng)絡(luò)配置為了語(yǔ)音識(shí)別系統(tǒng)的一部分,并且在識(shí)別準(zhǔn)確率上取得了實(shí)質(zhì)性進(jìn)展。然后我們和各種計(jì)算機(jī)視覺(jué)相關(guān)團(tuán)隊(duì)合作,比如圖片搜索和一些街景服務(wù)團(tuán)隊(duì),從而訓(xùn)練模型在給定的各種圖片的原始像素下做有趣的事情——從圖片中提取文本或者理解圖片內(nèi)容是什么(美洲豹、垃圾車等等)。

  有趣的是,隨著時(shí)間的推移,越來(lái)越多的團(tuán)隊(duì)開(kāi)始采用這些方法,因?yàn)樗麄兛倳?huì)聽(tīng)說(shuō)另一個(gè)團(tuán)隊(duì)用這些方法取得了好結(jié)果。我們會(huì)幫助這樣兩種團(tuán)隊(duì)建立聯(lián)系,或者,提供一些關(guān)于在特定的問(wèn)題情境中如何使用這些方法的基本建議。后來(lái)我們將此流程規(guī)范了一些,所以現(xiàn)在我們有一個(gè)專門的團(tuán)隊(duì)負(fù)責(zé)外聯(lián)。這是為正在產(chǎn)品中嘗試這些機(jī)器學(xué)習(xí)模型的團(tuán)隊(duì)建立聯(lián)系的第一點(diǎn)。他們會(huì)描述他們的問(wèn)題,然后外聯(lián)團(tuán)隊(duì)會(huì)告訴他們:「噢,聽(tīng)起來(lái)很像另外這個(gè)團(tuán)隊(duì)的問(wèn)題,這個(gè)解決方案會(huì)幫到您,試試并記得給我們反饋哦?!惯@種外聯(lián)團(tuán)隊(duì)的數(shù)量正在急劇增長(zhǎng)——從 2011 年、2012 年的幾個(gè)團(tuán)隊(duì)增長(zhǎng)到現(xiàn)在的 200 多個(gè)團(tuán)隊(duì),并且可能已有幾千人用我們團(tuán)隊(duì)的軟件訓(xùn)練過(guò)這種模型了。

  High: 你也是谷歌開(kāi)源機(jī)器學(xué)習(xí)庫(kù)——TensorFlow 的創(chuàng)始人之一。像其他幾家公司一樣,谷歌正關(guān)注開(kāi)源人工智能技術(shù)的開(kāi)發(fā)。請(qǐng)談?wù)勀銓?duì)使用開(kāi)源人工智能技術(shù)的理論基礎(chǔ)及優(yōu)勢(shì)的看法。

  Dean: 有許多不同的構(gòu)架來(lái)表達(dá)不同的開(kāi)源機(jī)器學(xué)習(xí)算法。我認(rèn)為有更多的選擇總是好的,但如果我們可以開(kāi)發(fā)出能獲得機(jī)器學(xué)習(xí)社區(qū)支持,大家一起來(lái)改進(jìn)的東西的話,也很好。其他許多人都在嘗試著相似的工作,所以如果我們能將重復(fù)工作的成果放在一起,構(gòu)成一個(gè)許多人都會(huì)采用的庫(kù)就會(huì)非常方便。原因是這會(huì)使機(jī)器學(xué)習(xí)想法的表達(dá)變得更簡(jiǎn)單。傳統(tǒng)的方式是人們寫一篇論文,談?wù)勊麄冇辛艘粋€(gè)想法,然后開(kāi)始探索,做一些實(shí)驗(yàn),但通常他們并不會(huì)公開(kāi)代碼,其他人便沒(méi)法重復(fù)這些實(shí)驗(yàn)。作為一個(gè)研究者,你正在看某人的論文,并嘗試將你自己的技術(shù)與其對(duì)比。通常,因?yàn)檎撐闹袥](méi)有代碼,你只能猜測(cè)那些代碼會(huì)是什么。并不是作者有意隱瞞,而是論文的屬性決定了其會(huì)省略大量細(xì)節(jié)。論文中可能會(huì)有像「我們使用了低的學(xué)習(xí)率」一樣的描述,然而你關(guān)心的可能是他們是否使用了 .0001 的學(xué)習(xí)率,在一萬(wàn)步后將其降低到更小值。所以建立一個(gè)軟件架構(gòu),讓人們可以以代碼的形式表達(dá)機(jī)器學(xué)習(xí)想法并將這些研究模型和想法以可執(zhí)行形式發(fā)布到這個(gè)構(gòu)架中,這使得想法的交流更加通暢。

  對(duì)于我們自己而言,這也使得我們與谷歌公司以外的人的合作更簡(jiǎn)單。通常我們會(huì)招暑期實(shí)習(xí)生,在過(guò)去,他們幾乎快完成實(shí)習(xí)項(xiàng)目的時(shí)候,仍然在寫關(guān)于他們工作的論文。但后來(lái)他們離開(kāi)了谷歌,沒(méi)法再接入谷歌的電腦了,這使得他們很難繼續(xù)完成他們的論文或者進(jìn)行更多的實(shí)驗(yàn)?,F(xiàn)在他們可以辦到了,只需要使用開(kāi)放源或者 TensorFlow,然后熟悉如何用 TensorFlow 表達(dá)機(jī)器學(xué)習(xí)想法的人就可能會(huì)過(guò)來(lái)幫忙。TensorFlow 正作為基礎(chǔ)教學(xué)工具,幫助我們教授許多谷歌工程師機(jī)器學(xué)習(xí)的知識(shí)。

  2015 年 11 月 9 日,倫敦時(shí)任市長(zhǎng) Boris Johnson 在探訪谷歌位于以色列特拉維夫市的辦公室期間佩戴虛擬現(xiàn)實(shí)眼鏡。

  High:谷歌的一個(gè)優(yōu)勢(shì)是在人工智能和機(jī)器學(xué)習(xí)上擁有大量人才。你們的研究部門負(fù)責(zé)人 Peter Norvig 曾估計(jì)說(shuō)谷歌在機(jī)器學(xué)習(xí)領(lǐng)域擁有世界上 5% 的頂尖專家。谷歌是如何變得對(duì)人才有如此吸引力的?而鑒于人工智能位于許多不同學(xué)科(計(jì)算機(jī)科學(xué)、工程學(xué)、神經(jīng)科學(xué)、生物學(xué)、數(shù)學(xué)等)的交叉領(lǐng)域,你認(rèn)為應(yīng)該怎樣將人才和技能組合到一起,以確保你能在正確的位置上安置合適的人才?

  Dean:因?yàn)槲覀兩孀愕念I(lǐng)域很多,所以我們需要擁有多種專業(yè)知識(shí)的人。我發(fā)現(xiàn),當(dāng)你把具有不同專業(yè)知識(shí)的人聚在一起去解決問(wèn)題時(shí),你會(huì)發(fā)現(xiàn)最終得到結(jié)果比那些只具備一種專業(yè)知識(shí)的一大群人一起做出來(lái)的要好??偟膩?lái)說(shuō),你最終做的事情,沒(méi)有人可以單獨(dú)做出來(lái)。我們的機(jī)器學(xué)習(xí)團(tuán)隊(duì)是一個(gè)很好的例子。我們有像我一樣在建設(shè)大規(guī)模計(jì)算系統(tǒng)方面有很多的經(jīng)驗(yàn)人,然后我們也有世界級(jí)的機(jī)器學(xué)習(xí)研究人員。把這些類型的人結(jié)合起來(lái)是一個(gè)非常強(qiáng)大的團(tuán)隊(duì)。機(jī)器學(xué)習(xí)正在接觸很多不同的領(lǐng)域。我們正在做的工作涉及醫(yī)療、機(jī)器人和計(jì)算機(jī)科學(xué)里的一大堆領(lǐng)域,這非常的好。在我們團(tuán)隊(duì)中有數(shù)位神經(jīng)科學(xué)專家。

  很快我們將開(kāi)始一個(gè)有趣的實(shí)驗(yàn),它被稱為「谷歌大腦培訓(xùn)項(xiàng)目(Google Brain Residency Program)」。我們正在招人到谷歌和我們的團(tuán)隊(duì)一起工作一年,基本上是學(xué)習(xí)如何做機(jī)器學(xué)習(xí)研究。我們有大量的申請(qǐng)者,這個(gè)項(xiàng)目最終會(huì)留下 28 個(gè)人。他們來(lái)自不同的背景,處在事業(yè)生涯的不同階段,有人剛剛完成本科學(xué)習(xí),有些人則讀完了博士,還有些人剛要結(jié)束他們的博士后階段,另一些人已經(jīng)在不同的行業(yè)干一段時(shí)間工作。但他們也帶來(lái)了計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)、數(shù)學(xué)、生物學(xué)、物理學(xué)的背景。我認(rèn)為這將會(huì)是一個(gè)很好的組合,在解決很多問(wèn)題時(shí)都有綜合不同的觀點(diǎn)。

  High:我很好奇,有很多不以技術(shù)為中心的傳統(tǒng)公司也會(huì)使用人工智能和機(jī)器學(xué)習(xí),你會(huì)在多大程度上與更多傳統(tǒng)公司工作和交流嗎?你如何看待公司對(duì)人工智能技術(shù)的采納曲線?顯然這涉及了不同公司甚至是不同行業(yè)。但也有一些領(lǐng)先的傳統(tǒng)行業(yè)開(kāi)始利用人工智能,包括醫(yī)療、金融服務(wù)公司、有大量非結(jié)構(gòu)化數(shù)據(jù)需要處理的公司。你是否曾經(jīng)有機(jī)會(huì)與傳統(tǒng)行業(yè)的公司互動(dòng)或者談?wù)撍麄冊(cè)诟觽鹘y(tǒng)的環(huán)境中走向人工智能的過(guò)程?

  Dean:其他行業(yè)的大多數(shù)公司可能沒(méi)有像谷歌或者其他技術(shù)公司那樣應(yīng)用機(jī)器學(xué)習(xí)。我認(rèn)為,隨著時(shí)間的推移,最終大多數(shù)公司將采用越來(lái)越多的機(jī)器學(xué)習(xí)。因?yàn)闄C(jī)器學(xué)習(xí)會(huì)逐漸強(qiáng)大到為他們的業(yè)務(wù)帶來(lái)革新。我們已經(jīng)與一些大型的醫(yī)療機(jī)構(gòu)討論了建立合作伙伴關(guān)系,看看什么機(jī)器學(xué)習(xí)可以為該領(lǐng)域的特定類型的問(wèn)題做些什么。我們最近推出了一個(gè)云機(jī)器學(xué)習(xí)產(chǎn)品,可以讓人們?cè)诠雀璧脑苹A(chǔ)設(shè)施上運(yùn)行機(jī)器學(xué)習(xí)算法,顯然有許多公司有興趣了解在他們的業(yè)務(wù)的環(huán)境中怎么使用該產(chǎn)品。

  我認(rèn)為這種轉(zhuǎn)變會(huì)發(fā)生的途徑之一是通過(guò)幾個(gè)層次,在這些層次中,你可以使用人工智能技術(shù)和機(jī)器學(xué)習(xí)的方法來(lái)解決問(wèn)題。在一些領(lǐng)域,了解圖像中有什么東西對(duì)很多行業(yè)來(lái)說(shuō)是普遍有用的。谷歌和其他公司正在提供使用起來(lái)比較簡(jiǎn)單的接口,在那里你不需要知道任何機(jī)器學(xué)習(xí)。你可以只給出一個(gè)圖像,然后說(shuō)「跟我說(shuō)說(shuō)這個(gè)圖像」,并且任何沒(méi)有機(jī)器學(xué)習(xí)專業(yè)知識(shí)的軟件工程師都可以使用,他們得到的信息會(huì)像是「照片上有個(gè)體育場(chǎng),人們?cè)谀抢锎虬羟?,而且圖像中還有一堆文字,文字是......」即使沒(méi)有應(yīng)用機(jī)器學(xué)習(xí),這也會(huì)是非常有用的。

  然后將會(huì)有已經(jīng)開(kāi)發(fā)好的模型,可以用公司的數(shù)據(jù)重復(fù)訓(xùn)練這個(gè)模型來(lái)得到一個(gè)定制化的解決方案,而無(wú)需做核心機(jī)器學(xué)習(xí)研究來(lái)開(kāi)發(fā)一個(gè)全新的模型。一個(gè)很好的例子是序列到序列的工作,現(xiàn)在已經(jīng)應(yīng)用到谷歌的六七個(gè)不同的問(wèn)題中。另一個(gè)很好的例子是一個(gè)采集圖像的模型,它能發(fā)現(xiàn)該圖像中有趣的部分。這個(gè)通用模型的一個(gè)應(yīng)用是檢測(cè)街道視野圖像中的文本在什么位置。你想能閱讀所有的文本,但是首先你必須能在店面前,路牌上等這類地方找到它們。這種通用模型在醫(yī)療環(huán)境中也有用,比如在診斷糖尿病性視網(wǎng)膜病變時(shí),你有一個(gè)視網(wǎng)膜的掃描圖像,你想找到該掃描圖像上的疾病指標(biāo),這時(shí)你就能用上這個(gè)模型了。用的是相同的模型結(jié)構(gòu),你只不過(guò)是在不同的數(shù)據(jù)中指出病變。你不是在用文本高亮顯示的街道視圖圖像,而是在醫(yī)生已經(jīng)圈好病變部位的視網(wǎng)膜圖像上指出它。我認(rèn)為通用模型的方法能很好地解決很多不同類型的問(wèn)題。

  High:在 3 月份,你至少是首次看到了 Alpha Go 在韓國(guó)取得的首場(chǎng)勝利。親身見(jiàn)證取得如此進(jìn)展感覺(jué)如何?對(duì)此次如同世界博覽會(huì)一樣的展示你有什么看法?在人工智能廣泛應(yīng)用于日常生活上,這對(duì)抓住人們的想象力、激起好奇心方面又什么更廣泛的影響?

  Dean:首場(chǎng)比賽我在現(xiàn)場(chǎng),比賽日程中的一半時(shí)間我也一直在韓國(guó)。難以相信當(dāng)時(shí)是多么的激動(dòng)。當(dāng)時(shí),中國(guó)有 3 億人觀看了首場(chǎng)比賽直播,他們有 18 個(gè)頻道在播送這場(chǎng)比賽,每個(gè)頻道都有不同的專業(yè)評(píng)論員。韓國(guó)也有類似的興奮。就像馬戲團(tuán)一樣。

  我認(rèn)為這種高調(diào)的事件展示了在人工智能相關(guān)的各類問(wèn)題上取得的重大進(jìn)展。我需要指出的是,Alpha Go 的大部分工作是由 DeepMind 團(tuán)隊(duì)在倫敦完成的。在項(xiàng)目的初始階段我們給了他們一些協(xié)助,他們也使用了我們的機(jī)器學(xué)習(xí)軟件訓(xùn)練 Alpha Go 的一些模型。他們也使用了一個(gè) Tensor 處理單元(Tensor Processing Unit,TPU),這是谷歌設(shè)計(jì)的定制版機(jī)器學(xué)習(xí)硬件芯片,在某種程度上它也是這場(chǎng)比賽的「秘密武器」。人們正在注意到這樣一個(gè)事實(shí),計(jì)算機(jī)有著它們四五年前還不具備的能力,這讓人很激動(dòng)。全球入學(xué)計(jì)算機(jī)科學(xué)系,學(xué)習(xí)機(jī)器學(xué)習(xí)課程的學(xué)生人數(shù)也在突飛猛漲。我認(rèn)為這是一件偉大的事,它不僅影響了計(jì)算機(jī)科學(xué),還有公司以及產(chǎn)業(yè)內(nèi)的所有事。有越多聰明的人思考這類問(wèn)題,社會(huì)就會(huì)得到進(jìn)步。

  High:有一些人高調(diào)地發(fā)出關(guān)于人工智能安全憂慮的警告,比如 Elon Musk、比爾蓋茨、霍金。你如何看待這種風(fēng)險(xiǎn)?當(dāng)你繼續(xù)思考人工智能相關(guān)進(jìn)程時(shí),你如何將此考慮到你的規(guī)劃中?

  Dean:我想我不太深信你提到的那些人擔(dān)心的末日情境。我不認(rèn)為這會(huì)成為現(xiàn)實(shí)。我認(rèn)為人工智能會(huì)導(dǎo)致社會(huì)變遷,這是之前難以實(shí)現(xiàn)的自動(dòng)化中的最大的一個(gè)方面,這關(guān)乎到大量的勞動(dòng)力。這些事情中有一些將被自動(dòng)化,即使可能不是完全的自動(dòng)化。計(jì)算機(jī)將能夠以各種方式提供協(xié)助,比如閱讀醫(yī)療圖像數(shù)據(jù),這是一個(gè)非常狹窄卻需要高技能的領(lǐng)域。我認(rèn)為計(jì)算機(jī)在不久之后會(huì)非常擅長(zhǎng)做這個(gè),更不要說(shuō)是計(jì)算機(jī)做自動(dòng)駕駛的能力了。我不確定政府是否正在謹(jǐn)慎的考慮這些技術(shù)帶來(lái)的影響,以及大體上它們對(duì)社會(huì)意味著什么。我想這才是更為急切的憂慮。確認(rèn)政策制定者正在認(rèn)真考慮這些問(wèn)題是非常重要的一步。

人物訪談