邁世·機房監(jiān)控體驗端
用戶名:Admin密碼:(無密碼) 點擊體驗導(dǎo)語
如何提升供電系統(tǒng)的可用性是數(shù)據(jù)中心機房的重中之重,以確保能夠獲得清潔、持續(xù)的電力資源對于其機房供電系統(tǒng)而言是必不可少的,數(shù)據(jù)中心機房的健康運營需要依靠持續(xù)的清潔電力供應(yīng),然而,從電源系統(tǒng)設(shè)計的哪怕一絲一毫的缺陷到整個電網(wǎng)發(fā)生的故障,都可能導(dǎo)致即使是最現(xiàn)代和先進(jìn)的機房陷入癱瘓,如何建立和維護(hù)一個高度可用的數(shù)據(jù)中心機房供電系統(tǒng)?下面我們一起來了解幾種解決方法。
1、首先審查電力系統(tǒng)
機房管理人員都認(rèn)為,自己對于其電力系統(tǒng)的交付能力是清楚知道的,然而,事實上,真正能夠做到這一點的數(shù)據(jù)中心管理人員是少之又少,這是因為大多數(shù)企業(yè)并沒有定期對他們的電力基礎(chǔ)設(shè)施進(jìn)行審計,只有通過審核電力系統(tǒng),企業(yè)組織用來支持該系統(tǒng)的操作流程,才能夠建立數(shù)據(jù)中心的最大負(fù)載參數(shù)。
當(dāng)需要把重要的新的IT工作負(fù)載投入生產(chǎn),但卻因為電力不足而無法做到時,僅僅靠依托產(chǎn)品規(guī)格和承包商的承諾會讓企業(yè)暴露在容量能力不足的困難風(fēng)險之下。
解決方案:定期徹底的審核您數(shù)據(jù)中心的電源系統(tǒng)。
2、采用標(biāo)準(zhǔn)化設(shè)施的工作流程
越來越多地機房利用標(biāo)準(zhǔn)化的最佳實踐框架,如信息技術(shù)基礎(chǔ)設(shè)施庫來幫助他們提高他們的工作流程系統(tǒng)化,不幸的是,一些企業(yè)的基礎(chǔ)設(shè)施部門采用了嚴(yán)格、統(tǒng)一的維護(hù)流程,如那些由ITIL定義的流程,而不是依靠特設(shè)的程序和基礎(chǔ)設(shè)施管理人員們所積累的專業(yè)知識。因此導(dǎo)致了數(shù)據(jù)中心電源和冷卻系統(tǒng)的維護(hù)標(biāo)準(zhǔn)往往較低,或與IT系統(tǒng)不太一致,進(jìn)而導(dǎo)致了停機時間的增加。
解決方案:雖然基礎(chǔ)設(shè)施流程框架作為ITIL尚有待開發(fā),但基礎(chǔ)設(shè)施部門可以而且應(yīng)該采取相應(yīng)的措施,以制定他們自己的標(biāo)準(zhǔn)化、文檔化的流程。按照一致的,可重復(fù)的方式進(jìn)行必要的活動,可以顯著降低功率和冷卻故障的可能性,同時提高基礎(chǔ)設(shè)施技術(shù)人員的工作效率。
3、更換過時的舊設(shè)備
當(dāng)你發(fā)現(xiàn)機房電力異常可能會影響到敏感電子設(shè)備的運行,并包括組件中斷,可能會對整個企業(yè)的業(yè)務(wù)產(chǎn)生重大影響,數(shù)據(jù)中心機房一般利用不間斷電源設(shè)備來防止電源異常。這樣的系統(tǒng)能夠清潔“臟”的電力系統(tǒng),并在供電中斷期間提供應(yīng)急電源。
然而,直到最近,相對于其功耗而言,可用性最高的雙轉(zhuǎn)換UPS 系統(tǒng)往往是效率最低的,反之亦然。因此,那些希望能夠盡量壓低運營成本的企業(yè)組織可能已經(jīng)部署實施了節(jié)能的UPS產(chǎn)品,這類產(chǎn)品交付低于平均水平的可用性;而那些更關(guān)注正常運行時間的企業(yè)組織則部署實施了高可用性的UPS系統(tǒng),同時也浪費了電力資源。
解決方案:今天,已充分市場充分驗證的成熟的UPS技術(shù)使得企業(yè)組織能夠在一款單一的設(shè)備中同時享受到高可用性和高效率。對于那些使用較舊的不間斷電源技術(shù)的企業(yè)組織而言,他們應(yīng)考慮升級到這種新一代的設(shè)備,以便能夠提高應(yīng)用程序的可用性,并同時降低總擁有成本。
4、著眼于長期價值,而不是短期成本
數(shù)據(jù)中心機房在建設(shè)或改造翻新時,短期的投入成本和企業(yè)長遠(yuǎn)的價值二者之間的優(yōu)先級別總是沖突的。企業(yè)的高級管理人員們通常都要督促負(fù)責(zé)數(shù)據(jù)中心建設(shè)的人員務(wù)必要盡可能的壓低成本,縮短完工時間。其結(jié)果是,在數(shù)據(jù)中心的建設(shè)項目中所涉及到的供應(yīng)鏈參與者、工程師、承包商和項目經(jīng)理們往往都是基于誰的報價最低、并承諾最快的設(shè)備交付,而做出設(shè)備的選擇決定,但如果這一價格水平的設(shè)備其實并不符合原數(shù)據(jù)中心建筑設(shè)計定義的操作規(guī)范的話,隨著時間的推移,其最終將以降低運營效率和正常運行時間的形式來讓企業(yè)組織付出昂貴的代價。
解決方案:當(dāng)對一處數(shù)據(jù)中心的建設(shè)或改造翻新項目進(jìn)行審查和決策時,企業(yè)的關(guān)鍵執(zhí)行人員務(wù)必應(yīng)該仔細(xì)審查采購決策,確保一線的項目管理人員和承包商并沒有以犧牲企業(yè)的長期利益為代價,來換取短期的成本壓縮。他們也應(yīng)該清楚明確地傳達(dá)嚴(yán)格遵守數(shù)據(jù)中心原始設(shè)計操作規(guī)范的重要性,即使這意味著在施工過程中的花費會更多一點。
5、實現(xiàn)企業(yè)范圍內(nèi)的監(jiān)控和主動診斷
與流行的看法相反,很少有系統(tǒng)故障沒有提前發(fā)出過警告,除非是在發(fā)生了災(zāi)害的情況下。僅僅只是系統(tǒng)所發(fā)出的警告太常被忽視,因為在本質(zhì)上其是監(jiān)控系統(tǒng)的自然反應(yīng),假設(shè)一款UPS在某個深夜發(fā)生了故障,進(jìn)而造成了您企業(yè)組織數(shù)據(jù)中心運行中斷。那么很可能的情況則是,UPS已經(jīng)在故障發(fā)生前的幾天或幾小時已經(jīng)提前發(fā)出過相關(guān)的暗示或警號信號。例如,也許UPS或其電池已開始過熱或出現(xiàn)性能下降。然而,如果數(shù)據(jù)中心的基礎(chǔ)設(shè)施管理人員沒有監(jiān)測到這些性能指標(biāo),他們可能也不知道即將發(fā)生的故障,直到其最終發(fā)生。
解決方案:最新的企業(yè)管理產(chǎn)品可以幫助企業(yè)監(jiān)控和主動管理涉及到關(guān)鍵任務(wù)的設(shè)備,包括電力設(shè)備,環(huán)境和生命/安全系統(tǒng)。但是如若沒有經(jīng)過事先的細(xì)致咨詢就匆忙上馬,那么,即使是最好的軟件也沒有什么太大的幫助。因此,盡管數(shù)據(jù)中心選擇部署電力系統(tǒng)監(jiān)測和診斷軟件是一個重要的開始,但其基礎(chǔ)設(shè)施部門也必須確保他們有嚴(yán)格的工作流程提前為即將安裝的軟件進(jìn)行咨詢,并迅速響應(yīng)危險的跡象。
6、維護(hù)一個基礎(chǔ)設(shè)施變更管理數(shù)據(jù)庫
對于其所進(jìn)行的所有維護(hù)程序都保持一份全面和準(zhǔn)確的文檔記錄,對于確保機房的安全是至關(guān)重要的,此外,一旦發(fā)生事故,維修記錄可以為在第一時間找出造成潛在的災(zāi)難性的系統(tǒng)故障的根本原因提供重要的線索,在緊急情況下,對于確保對于重要數(shù)據(jù)的及時訪問是至關(guān)重要的時候特別有價值。然而僅僅只有很少一部分的企業(yè)基礎(chǔ)設(shè)施部門維護(hù)了一套CMDB。其結(jié)果是,關(guān)于其數(shù)據(jù)中心的不間斷電源系統(tǒng)(UPS)或關(guān)于當(dāng)前哪些服務(wù)器或其它相關(guān)負(fù)載正在被處理等等諸如此類的唯一記錄都只存在于管理人員的頭腦里。而一旦這位管理人員離職或退休,這些寶貴的紀(jì)錄便隨之離開了,這無疑會使得數(shù)據(jù)中心被暴露在不必要的停機風(fēng)險之下,同時電源/冷卻設(shè)備受干擾后也將需要更長的恢復(fù)時間。
解決方案:企業(yè)數(shù)據(jù)中心的基礎(chǔ)設(shè)施部門應(yīng)建立并嚴(yán)格維護(hù)他們自己的CMDB。ITIL的指導(dǎo)方針為這一舉措提供了一個有用的起點,企業(yè)組織也可以利用各種專門的CMDB軟件應(yīng)用程序。
7、采用適合企業(yè)需求的電力系統(tǒng)拓?fù)浣Y(jié)構(gòu)
電力系統(tǒng)的拓?fù)浣Y(jié)構(gòu)對采購成本、運營費用、可靠性和平均維修時間有著重要的影響。對于一處既定的數(shù)據(jù)中心,您所設(shè)計的冗余越多,那么在其建造和運行過程中您企業(yè)所花費的成本也就會越多,但其也能夠更快地從中斷中恢復(fù),國際正常運行時間協(xié)會(The Uptime Institute)是一家專為企業(yè)數(shù)據(jù)中心的業(yè)主和運營商服務(wù)的獨立的研究機構(gòu)。該機構(gòu)為數(shù)據(jù)中心的關(guān)鍵任務(wù)設(shè)施定義了四項電源系統(tǒng)拓?fù)浣Y(jié)構(gòu)來說明這一原理:
較之Tier III或Tier IV拓?fù)?,一個Tier I或Tier II的拓?fù)湎鄬Ρ阋?,但同時也提供了較少的可靠性和正常運行時間。
解決方案:當(dāng)涉及到選擇一款電力系統(tǒng)的拓?fù)浣Y(jié)構(gòu)時,并沒有唯一正確的答案。企業(yè)組織應(yīng)將他們的特殊業(yè)務(wù)情況和需求與其電力系統(tǒng)的拓?fù)浣Y(jié)構(gòu)相匹配,假設(shè)多個備份站點是可用的,那么用戶如果偶爾會遇到幾秒鐘的延遲的話,他們不太可能會過多抱怨。然而,如若是在華爾街,哪怕僅僅幾秒鐘的延遲所可能導(dǎo)致的損失則也是以數(shù)百萬美元計算的。因此,一處托管了金融交易應(yīng)用程序的數(shù)據(jù)中心,選擇采用一個Tier IV拓?fù)浣Y(jié)構(gòu)將是明智的。
8、服務(wù)器是不能夠斷電的,機房是如何保證電力不中斷的?
簡單的來說,要保證電力不中斷采取的有效辦法是多路電力系統(tǒng)并聯(lián),一條中斷,另一條則立即啟動,實際上因為服務(wù)器對電力的持續(xù)性要求很高,所以不管是哪一個機房在應(yīng)對這個問題的時候都是很謹(jǐn)慎的。比如成都的西信中心,其IDC機房大樓采用4路獨立不同變電站市電輸入,并配備24臺2000KW柴油發(fā)電機和3臺3000KW燃?xì)廨啺l(fā)電機,總輸出達(dá)5.9萬KW。斷電后持續(xù)1小時以上的UPS系統(tǒng),電力可用性達(dá)到99.99%;年計劃維護(hù)斷電時間累計不超過30分鐘,保證每個機柜從不同配電柜引電接入實現(xiàn)雙路供電。
像今年夏天這種情況,中國超過1/3的地區(qū)都處在持續(xù)高溫天氣之下,電力的需求大量提升,市電隨時都有可能中斷?;蛘呤怯龅搅撕闉?zāi)、地震之類的自然災(zāi)害,如果機房的電力系統(tǒng)全部來自市電,仍然會存在電力中斷的風(fēng)險。所以一家好的IDC機房會配備自己的發(fā)電設(shè)備,以應(yīng)對不時之需。
運維一處大型的、散熱量大且復(fù)雜的數(shù)據(jù)中心的可用性比以往任何時候都更為困難,也更具重要的戰(zhàn)略性意義。特別是考慮到當(dāng)前的全球經(jīng)濟(jì)一體化,可持續(xù)發(fā)展的壓力和普遍的人口老齡化所導(dǎo)致的勞動力減少的大背景之下。企業(yè)組織已經(jīng)利用了各種技術(shù)和流程,以確保關(guān)鍵任務(wù)的IT 系統(tǒng)能夠獲得清潔,可靠的電力資源供應(yīng)。
如果您想了解更多關(guān)于一體化機柜的信息,或者您有任何疑問,請致電:400-030-5510。邁世為您提供24小時在線客戶服務(wù),我們將竭誠為您服務(wù)! 同時,邁世是中國 機房監(jiān)控 解決方案供應(yīng)商與服務(wù)商,可以為您提供更多的解決方案。
@本文轉(zhuǎn)載于網(wǎng)絡(luò)
本文標(biāo)簽: 機房供電系統(tǒng) 機房配電監(jiān)控 機房電力監(jiān)控
智慧機房在線體驗
400電話
微信掃一掃