數(shù)據(jù)中心應(yīng)急備份技術(shù)解析
數(shù)據(jù)中心是各種數(shù)據(jù)集中處理的場所,運行起來各種系統(tǒng)異常復(fù)雜。從數(shù)據(jù)中心開始運行直到生命周期結(jié)束,任何一個數(shù)據(jù)中心也無法做到不出問題,就算是谷歌、阿里等互聯(lián)網(wǎng)巨頭公司的技術(shù)先進的數(shù)據(jù)中心也會出現(xiàn)這樣那樣的問題。正因為這樣,涌現(xiàn)出了很多的備份技術(shù),對數(shù)據(jù)中心運行的各個環(huán)節(jié)進行備份,一旦主設(shè)備運行出現(xiàn)了問題,可以有備份設(shè)備接管繼續(xù)運行,確保數(shù)據(jù)中心業(yè)務(wù)不受嚴(yán)重影響。在中大型數(shù)據(jù)中心里,都部署了很多的備份設(shè)備和技術(shù),對關(guān)鍵系統(tǒng)進行備份,以防因為部分設(shè)備故障導(dǎo)致數(shù)據(jù)中心業(yè)務(wù)癱瘓。所以對于數(shù)據(jù)中心,備份技術(shù)不可缺少。本文主要講的是應(yīng)急備份技術(shù),既然是應(yīng)急自然是對突然發(fā)生的需要緊急處理的事件,應(yīng)急備份技術(shù)指的是應(yīng)對突發(fā)故障的備份技術(shù)。數(shù)據(jù)中心應(yīng)急備份技術(shù)有很多,本文主要講的是數(shù)據(jù)中心里最為重要的幾種技術(shù)。
應(yīng)急電源技術(shù)
數(shù)據(jù)中心的正常運轉(zhuǎn)離不開電,持續(xù)穩(wěn)定的供電對于數(shù)據(jù)中心尤為重要。但是在很多時候,由于各種原因數(shù)據(jù)中心還是可能發(fā)生斷電現(xiàn)象,比如:市電供電線路故障、數(shù)據(jù)中心內(nèi)部部分設(shè)備或線路短路等,造成數(shù)據(jù)中心部分設(shè)備或整體發(fā)生斷電。正是這樣,所以在數(shù)據(jù)中心里從供電輸入到設(shè)備輸入都有多級的備份裝置,就是防止設(shè)備出現(xiàn)斷電。我們知道數(shù)據(jù)中心的電絕大多數(shù)來自于市電電網(wǎng),能否自己有發(fā)電站,自己供電的數(shù)據(jù)中心很少,在國內(nèi)還沒有看到有,除了市電,一般還有另外一路應(yīng)急電源輸入。當(dāng)市電出現(xiàn)故障時,自動切換到應(yīng)急電源。當(dāng)我們走進數(shù)據(jù)中心園區(qū)時,在機房建筑物的外面有時會看到幾座很大的供電箱體,上面寫著應(yīng)急電源,這個平時并不工作,一直在蓄電,一旦市電故障蓄電池就會啟動工作。這個應(yīng)急電源會根據(jù)數(shù)據(jù)中心的容量,一般可以工作十幾個小時,作為數(shù)據(jù)中心臨時供電輸入。很多數(shù)據(jù)中心都用蓄電池方式作為應(yīng)急電源,這使得蓄電池方式的應(yīng)急電源特別多,比如:鉛酸蓄電池、飛輪儲能蓄電池、超級電容器、燃料電池、鋰離子電池等,這些蓄電池工作原理上有所差異,各有優(yōu)缺點,基本原理都是平時存儲電能,在數(shù)據(jù)中心斷電時臨時啟動工作。還有的數(shù)據(jù)中心自己準(zhǔn)備有一組柴油發(fā)電機組,需要其工作時柴油發(fā)電機組開始工作,這個工作起來噪聲大、廢氣多,對周圍環(huán)境有很大影響,不過比蓄電池要工作時間長些。在一些運營商企業(yè)自己還準(zhǔn)備了一些移動應(yīng)急電源,在數(shù)據(jù)中心出現(xiàn)斷電時,這些載有蓄電池的汽車會直接開到數(shù)據(jù)中心完成供電,這種方式非常靈活、方便。
應(yīng)急冷源技術(shù)
數(shù)據(jù)中心內(nèi)部要保持恒溫恒濕,空調(diào)系統(tǒng)必須全年24小時運轉(zhuǎn),一旦出現(xiàn)故障,時間一長數(shù)據(jù)中心內(nèi)部的溫度就會上來,很多服務(wù)器設(shè)備在溫度超過40度時都會自動重啟來保護設(shè)備器件,防止溫度過高對設(shè)備造成損害。在這種情況下,數(shù)據(jù)中心就無法正常運轉(zhuǎn),所以數(shù)據(jù)中心還需要準(zhǔn)備應(yīng)急冷源。蓄冷裝置可在供冷中斷時當(dāng)作應(yīng)急冷源使用,對于大型數(shù)據(jù)中心蓄冰裝置更合適,動態(tài)制冰、外融冰盤管、冰球等都可以作為數(shù)據(jù)中心的應(yīng)急冷源,應(yīng)急冷源在實際使用中,往往可能會待機幾個月不投入使用,其內(nèi)儲存的冰在長期待機過程中會因散熱而滿滿融化,導(dǎo)致冷量損失,所以要持續(xù)進行制冰處理,保持蓄冰裝置內(nèi)任何時候都有足量的冰。應(yīng)急冷源對于數(shù)據(jù)中心來說利用率不高,但是卻要耗費大量的人力、物力來維護,所以實際數(shù)據(jù)中心采用的很少,一般都通過空調(diào)系統(tǒng)的備份、冗余來做到冷源備份,這種方式比起直接建造一個蓄冰空間并維護要省錢得多。
應(yīng)急照明技術(shù)
應(yīng)急照明是消防安全的要求,不僅是數(shù)據(jù)中心,任何建筑都需要有應(yīng)急照明。數(shù)據(jù)中心在這方面沒有什么差異,一般講應(yīng)急照明燈安裝在機房內(nèi)墻壁上,部署在機柜兩側(cè)的墻壁上。在正常照明電源發(fā)生故障時,能有效地照明和顯示疏散通道,或能持續(xù)照明而不間斷工作的一類燈具。這些應(yīng)急照明平時并不工作,當(dāng)數(shù)據(jù)中心照明系統(tǒng)斷電或者市電斷電時,自行啟動工作,確保在危機的情況下,數(shù)據(jù)中心內(nèi)部人員可以得到安全疏散,應(yīng)急照明主要還是從建筑安全的角度考慮的。
應(yīng)急設(shè)備技術(shù)
數(shù)據(jù)中心里的設(shè)備很多,幾乎每天都會有這樣那樣的故障,很多時候設(shè)備發(fā)生了硬件故障或者是未知的軟件故障,就需要對設(shè)備進行更換,確保不對數(shù)據(jù)中心整體業(yè)務(wù)影響,所以一般數(shù)據(jù)中心都會建一個小型的備件庫,對于重要核心的設(shè)備部件備用幾套,以防設(shè)備出現(xiàn)故障時,可以有備件更換。數(shù)據(jù)中心的備件庫用來儲存?zhèn)溆迷O(shè)備和器件,對環(huán)境的要求和數(shù)據(jù)中心機房相同,要保持恒溫恒濕,灰塵濃度要低,防止備件在長時間放置過程中元器件發(fā)生氧化。很多時候,有的數(shù)據(jù)中心備件一放就是幾年,當(dāng)真需要用的時候拿出來發(fā)現(xiàn)已經(jīng)不能用了,這就起不到備份的效果,所以數(shù)據(jù)中心還要周期性地對備件庫里的備件設(shè)備進行檢查,并上下電檢測一下設(shè)備運行是否完好,避免出現(xiàn)損壞的情況。很多設(shè)備在長時間不使用的情況下,也會出現(xiàn)器件老化而故障的現(xiàn)象,需要通過檢查來避免。
本文介紹了幾種數(shù)據(jù)中心應(yīng)急備份的技術(shù),可以看到這些備份技術(shù)都是硬件備份技術(shù),其實數(shù)據(jù)中心更多的是軟件層面的備份,有很多的軟件備份、冗余技術(shù),在此不再詳說。這些應(yīng)急備份是數(shù)據(jù)中心安全運行必可缺少的重要組成部分,既然是備份就是很多時候并不在工作,這樣數(shù)據(jù)中心就要考慮運行效率,如果數(shù)據(jù)中心整體運行安全系數(shù)比較高的話,就可以適當(dāng)減少應(yīng)急備份的投入,不怕一萬就是萬一,不管怎樣應(yīng)急備份對于數(shù)據(jù)中心,不可缺少。