“大數(shù)據(jù)”時代需警惕“數(shù)據(jù)暴政”
對于大多數(shù)人來說,“大數(shù)據(jù)”還是一個陌生的術(shù)語,但它的威力已無所不在:信用卡公司追蹤客戶信息,能迅速發(fā)現(xiàn)資金異動,并向持卡人發(fā)出警示;能源公司利用氣象數(shù)據(jù)分析,可以輕松選定安裝風(fēng)輪機的理想地點;瑞典首都斯德哥爾摩使用運算程序管理交通,令市區(qū)擁堵時間縮短一半……
牛津大學(xué)教授維克多·梅耶-舍恩伯格在其新書《大數(shù)據(jù)》中說,這是一場“革命”,將對各行各業(yè)帶來深刻影響,甚至改變我們的思維方式,但同時它也引發(fā)“數(shù)據(jù)暴政”的擔(dān)憂。
商業(yè):提供“精準預(yù)測”
在一些公司、實驗室和政府機構(gòu),“數(shù)據(jù)”被捧為21世紀新型“石油”或“黃金”。一些統(tǒng)計學(xué)家、物理學(xué)家和所謂的數(shù)據(jù)科學(xué)家從中獲利豐厚,他們服務(wù)于大數(shù)據(jù)應(yīng)用程序開發(fā)公司,“藍色彼岸”便是其中之一。
“藍色彼岸”成立于5年前,目前有85名員工。經(jīng)理尤韋·魏斯介紹,公司利用自行開發(fā)的軟件,分析超市刷卡記錄、天氣資訊、學(xué)校放假信息和交通報告等數(shù)據(jù),為客戶提供“精準預(yù)測”。他們的客戶包括德國郵購業(yè)泰斗奧托集團和dm連鎖藥店。
魏斯說,“藍色彼岸”的軟件不僅能從單條信息中分析出更多內(nèi)容,而且能發(fā)現(xiàn)信息間關(guān)聯(lián),對零售業(yè)極為有用,可以避免發(fā)貨出錯,最大限度降低庫存成本。
奧托集團說,自從使用“藍色彼岸”的軟件,銷售預(yù)測準確度提高20%到40%。它準備把該軟件應(yīng)用推廣到公司運動品牌零售商SportScheck,并收購“藍色彼岸”50%股權(quán)。
“大數(shù)據(jù)正在重塑整個經(jīng)濟,我們只是處于起步階段,”魏斯說。
醫(yī)療:開啟個性化治療
位于柏林巴伯爾斯貝格地區(qū)的哈索·普拉特納研究所(HPI)可能成為數(shù)以百萬計癌癥患者的希望。研究所二樓的計算機房常年保持低溫,以免價值150萬歐元的處理器過熱。普通計算機只有1個處理器,但那里的每臺計算機有40個處理器,運算速度是傳統(tǒng)計算機的1000倍,甚至更快。
普拉特納是全球最大的企業(yè)管理和系統(tǒng)化商務(wù)解決方案供應(yīng)商“思愛普”(SAP)創(chuàng)始人,也是HPI贊助人。他介紹說,HPI的漢娜數(shù)據(jù)庫技術(shù)始于一個名叫“Sanssouci DB”項目,由8個大學(xué)生創(chuàng)立,曾獲得創(chuàng)新大獎,如今已成為“內(nèi)存儲處理”的代名詞。
HPI負責(zé)人、數(shù)學(xué)家克里斯托弗·邁內(nèi)爾認為,該技術(shù)不僅有廣泛的商業(yè)前景,而且為癌癥治療提供機遇,“我們正站在個性化醫(yī)療的門檻上”。
邁內(nèi)爾說,每一種腫瘤都不盡相同,這意味著同樣的治療方法對不同人會產(chǎn)生不同效果。目前,為了給患者制定有針對性的治療方案,需花費數(shù)月破譯其基因組。這并不奇怪,因為每個人有大約30億個DNA“積木”。但在HPI“超級大腦”的幫助下,破譯基因組只需要短短數(shù)秒。
此外,HPI的電腦可以從公共基因庫中精選所有信息,為每一個患者尋找到最合適他癥狀的治療方案?!澳壳?這種搜索配對過程還需花費數(shù)月時間,”邁內(nèi)爾說。
安全:助力抓賊反恐斗黑客
在美國加州圣克魯斯市一個地下車庫,一名小偷正在撬車,卻被幾米開外正在一輛車里吃午餐的警察逮了個正著。這名警察并非“碰巧”出現(xiàn)在那里,而是根據(jù)一個計算機軟件的推薦在此守株待兔。
過去兩年里,這座城市的警察換班時,都會根據(jù)長官和軟件發(fā)出的指示外出巡邏。該軟件輸入了警方所有數(shù)據(jù),不斷更新,用于計算何時何地可能發(fā)生夜盜、搶劫、偷車等犯罪行為,其中三分之二切實發(fā)生了。
這一軟件由計算機專家喬治·莫勒和從事犯罪學(xué)研究的人類學(xué)家杰弗里·布蘭廷漢姆聯(lián)合編寫,參照了預(yù)測地震余震的程序模式。圣克魯斯警察局副局長史蒂夫·克拉克于2011年偶然得知這一創(chuàng)意,三人共同開展了一個測試項目。他們把圣克魯斯市8年來的犯罪記錄輸入程序,再加上其他潛在相關(guān)數(shù)據(jù),比如天氣狀況、公園資訊和公交線路等。
“起初,很多人持懷疑態(tài)度,包括我自己,”克拉克說,“但數(shù)據(jù)本身證明其確實有效?!睋?jù)他介紹,使用犯罪預(yù)測系統(tǒng)一年后,夜盜案件減少11%,盜車案件減少8%,破案率大幅提升56%。
除警察局外,軍隊和情報機構(gòu)也非常重視數(shù)據(jù)分析。比如,在搜尋本·拉丹的過程中,“大數(shù)據(jù)”就發(fā)揮了重要作用,正是數(shù)據(jù)庫分析讓調(diào)查人員把目光聚焦在巴基斯坦的阿伯塔巴德。
Splunk是情報界和軍方炙手可熱的軟件供應(yīng)商,總部設(shè)在舊金山一家舊香腸工廠里。不久前,在科技記者評出的全球最具創(chuàng)意的公司中,Splunk名列第5,而谷歌僅列第11位。全球超過90個國家的政府、機構(gòu)、企業(yè)在使用Splunk的應(yīng)用軟件,包括美國五角大樓和國土安全部。這家公司分析、破譯來自各種機器的數(shù)據(jù),包括手機信號塔、空調(diào)、網(wǎng)站服務(wù)器和飛機等。Splunk產(chǎn)品部高級副總裁圭多·施羅德說,分析渦輪機提供的數(shù)據(jù)有助于最大程度降低燃油消耗,優(yōu)化維修間隔期。
“安全領(lǐng)域是‘大數(shù)據(jù)’應(yīng)用增長最快的領(lǐng)域之一,”施羅德說。除對付犯罪和恐怖主義外,Splunk的軟件還能查明黑客攻擊等網(wǎng)絡(luò)犯罪。
警惕“數(shù)據(jù)暴政”
個性化服務(wù)是“大數(shù)據(jù)”應(yīng)用程序魅力所在。比如,如果有人在“臉譜”上表示“喜歡”某款牛仔褲,當(dāng)他下次進入該店鋪時,就可能收到店主給他發(fā)送的同品牌牛仔褲的打折信息??雌饋?這對零售商和消費者都有好處,但主張保護數(shù)據(jù)隱私的人卻認為,“大數(shù)據(jù)”理念其實與“專制獨裁”沒有區(qū)別。
為消除人們顧慮,許多公司強調(diào)他們收集、儲存、分析數(shù)據(jù)都是“匿名”,但事實上可能并非如此。在線期刊《科學(xué)報道》近期一項研究顯示,每個人有自己的行動模式,95%的人可能被識別。普林斯頓計算機科學(xué)家阿爾溫德·納拉亞南在其博客上說,可供分析的數(shù)據(jù)越多,就越不可能保持“匿名”,識別一個人只要33個字節(jié)的信息量。
在現(xiàn)代社會,一個更加迫切的問題是:人們是否真的愿意接受一個“數(shù)字驅(qū)動經(jīng)濟”的世界?在這個世界里,數(shù)據(jù)分析能預(yù)測你的孩子在學(xué)校表現(xiàn)如何,他將來適合怎樣的工作,誰有多大幾率犯罪或得癌癥,電視臺和唱片公司能根據(jù)預(yù)測迎合觀眾或聽眾的口味……但在這個一切都計算好的世界里,創(chuàng)意、靈感和驚喜在哪里?
互聯(lián)網(wǎng)哲學(xué)家葉夫根尼·莫羅佐夫?qū)υS多“大數(shù)據(jù)”應(yīng)用程序背后的意識形態(tài)提出尖銳批評,警告即將發(fā)生“數(shù)據(jù)暴政”。他提出,那些“大數(shù)據(jù)”應(yīng)用程序應(yīng)當(dāng)接受獨立審計人定期審查,以防權(quán)力濫用。
“大數(shù)據(jù)”行業(yè)巨頭谷歌的一次不經(jīng)意行為,顯示了人們對“數(shù)據(jù)暴政”的警惕。谷歌董事長埃里克·施密特說,公司在2010年曾閃過這樣一個玩笑想法:通過數(shù)據(jù)分析預(yù)測股票價格,但后來放棄了,因為公司高管認為,這可能不合法。
但他沒有說,這是不可能的。