RFID等新技術(shù)引發(fā)“數(shù)據(jù)爆炸”
今天的商務(wù)收集并存儲了比以往更多的數(shù)據(jù)。我們說生活在信息時代,數(shù)據(jù)就是新經(jīng)濟的資本。隨著需要存儲的數(shù)據(jù)的數(shù)量的激增,企業(yè)比以往的任何時候都更加依賴于數(shù)據(jù)庫管理系統(tǒng)來處理公司的數(shù)據(jù),以及原始數(shù)據(jù)中非常有用的商業(yè)信息。
在每一年,我都會參觀很多不同的企業(yè),這也是我工作的一部分,其中有一件事情是一致的:數(shù)據(jù)庫的規(guī)模在不斷擴大。我從來沒有遇見一個數(shù)據(jù)庫管理員對我說,“你知道嗎,我的數(shù)據(jù)庫變小了,我沒法對它進行操作了?!辈?,情況恰恰相反。任何一個地方的企業(yè)都正在努力面對他們公司的數(shù)據(jù)庫由于規(guī)模擴大產(chǎn)生的沉重負擔。
Winter 公司,是一家研究和咨詢機構(gòu),每半年出版一份全世界前十位最大、負擔最沉重的數(shù)據(jù)庫(點擊這里查看詳細內(nèi)容)。在最近的一份Winter的報告中,2003年出版的,肯定了數(shù)據(jù)的激增。Winter的報告說最大的數(shù)據(jù)倉庫實現(xiàn)已經(jīng)長到了30TB,最大的正在運轉(zhuǎn)的數(shù)據(jù)庫具有20TB的數(shù)據(jù)。這些是最大的。在線事務(wù)處理(OLTP)數(shù)據(jù)庫已經(jīng)從2001年的1TB增加到了2003年的4.4TB。
越來越多的數(shù)據(jù)是今天商業(yè)面對的一個現(xiàn)實,還有,企業(yè)的數(shù)據(jù)庫也在規(guī)模上不斷增長。實際上,使用的技術(shù)也在不斷增加,并且變得越來越復雜,但是數(shù)據(jù)增長速率確實爆炸的速度。有以下幾個因素導致了這種增長。
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘應(yīng)用程序鼓勵我們存儲越來越長的時間段內(nèi)越來越多的數(shù)據(jù)。這樣的實際情況導致的可分析出來的前景是成本的大量增加。網(wǎng)絡(luò)應(yīng)用也可以增加數(shù)據(jù)的增長速度。監(jiān)控點擊流需要存儲與以往相比越來越多的不同的數(shù)據(jù)類型,多媒體數(shù)據(jù)也增加了對存儲的要求。但我們存儲并管理的不僅僅是數(shù)字和文字,還有視頻、音頻、圖像、臨時數(shù)據(jù)以及更多內(nèi)容,數(shù)據(jù)的增長速度也在不斷地上升。
今天,大多數(shù)的企業(yè)都部署了多個異構(gòu)的計算機系統(tǒng)——從大型的主機到中等規(guī)模的工作組網(wǎng)絡(luò),再到個人計算機。同樣的數(shù)據(jù)同時在所有這些不同的平臺上存在。企業(yè)要將數(shù)據(jù)多次拷貝到多個平臺和數(shù)據(jù)庫管理系統(tǒng)產(chǎn)品上,數(shù)據(jù)通常放置在單個集中式的系統(tǒng)。所以異構(gòu)引起了數(shù)據(jù)的增長。
新生的技術(shù),例如RFID標簽,將會進一步增加必須進行維護和保證可訪問性的數(shù)據(jù)的泛濫。實際上,數(shù)據(jù)庫系統(tǒng)的需求也在未來越走越遠,同樣也需要更多的數(shù)據(jù)庫管理員來管理這些數(shù)據(jù)庫。