別讓大數(shù)據(jù)之海湮沒數(shù)據(jù)價值
計算技術的誕生,預示了大數(shù)據(jù)時代的到來。從大型計算單元到微型處理器,從巨型計算機到微型服務器、PC以及今天不斷涌現(xiàn)的移動終端,計算平臺和設備的覆蓋范圍不斷擴展,為海量數(shù)據(jù)的采集與處理不斷提供著可能。
微處理器的演進不僅推動著計算平臺的革新,也促進著智能設備向人們生活各個領域的滲透,從VCR、空調系統(tǒng)、汽車剎車系統(tǒng)到智能電視、家庭影院系統(tǒng),再到可節(jié)約用水、大幅縮短洗衣時間的環(huán)保型洗衣機,當這些設備與互聯(lián)網(wǎng)相連時,各種設備產(chǎn)生的數(shù)據(jù)將有機會匯入同一個數(shù)據(jù)海洋,這才是大數(shù)據(jù)能讓人感到興奮的地方。但如何從數(shù)據(jù)海洋中找到應用所需的關鍵數(shù)據(jù)又成了一個新的問題。
今天,亞馬遜、阿里巴巴、騰訊等公司收集了數(shù)以百萬計的交易和網(wǎng)頁點擊數(shù)據(jù)。對互聯(lián)網(wǎng)公司而言,用以判斷用戶在線瀏覽和購買傾向的數(shù)據(jù)卻可能因為數(shù)據(jù)規(guī)模變大而更難挖掘。
毫無疑問,可連接的物件將為人們的生活帶來全新的體驗。在物聯(lián)網(wǎng)的情境中,數(shù)據(jù)來自傳感器、控制器以及其他嵌入式智能器件。對于消費者而言,物聯(lián)網(wǎng)的核心是個人應用。以時下流行的“量化自我”為例,它是一場將技術融入個人日常生活,以便完成數(shù)據(jù)采集的運動。數(shù)據(jù)采集涉及攝入(如食物攝取、周圍空氣質量)、狀態(tài)(如情緒、興奮、血液氧氣含量)和行為(包括心理及生理)等方面。對“自我的監(jiān)控”和“自我的感知”都可以變成可量化的數(shù)據(jù),通過穿戴式傳感器、穿戴式計算技術進行采集與分析。但每個人身上哪些數(shù)據(jù)是有價值的,可以為何種個人應用服務,又該如何科學、安全地采集并加以利用,在沒回答這些問題之前,就盲目讓個人信息匯入大數(shù)據(jù)之海,并通過互聯(lián)網(wǎng)進行分享,風險可想而知。
在公共服務方面,國外已出現(xiàn)了借助“停車位置傳感器”這樣的嵌入式智能器件幫人們尋找停車位的實例。SF Park和 Streetline可收集并分發(fā)街道及停車場中停車位的相關實時信息,這不僅免去了司機兜圈尋找停車位的麻煩,還減少了交通擁堵現(xiàn)象。它還能幫助停車場的運營商,根據(jù)各區(qū)域停車位的需求狀況相應減少或增加停車計時器的數(shù)量,調整停車場的泊車價格。雖然計算技術的演進和互聯(lián)網(wǎng)的發(fā)展,已經(jīng)讓人們感受到了物聯(lián)網(wǎng)的美好,但在各種數(shù)據(jù)匯入大數(shù)據(jù)之海時,其標準與格式的統(tǒng)一依舊存在很多問題,數(shù)據(jù)交換也未必安全。大數(shù)據(jù)之海很可能因此湮沒數(shù)據(jù)價值。