數(shù)據(jù)中心基礎(chǔ)設(shè)施的運維服務(wù)
安全生產(chǎn)永續(xù)運行是數(shù)據(jù)中心核心目標之一。新建數(shù)據(jù)中心項目的運行維護相當復雜,但行業(yè)內(nèi)對基礎(chǔ)設(shè)施運維能力關(guān)注并不多,很多項目對基礎(chǔ)設(shè)施運維需求并沒有清晰全面的描述。
回顧參加數(shù)據(jù)中心基礎(chǔ)設(shè)施建設(shè)和運行的經(jīng)驗教訓,筆者認識到關(guān)注數(shù)據(jù)中心運行維護需求,打造基礎(chǔ)設(shè)施級可維護能力,不僅大量減少建設(shè)過程中的變更、返工,還可減少運行故障隱患,并避免投產(chǎn)后的改造。在此,特初步梳理基礎(chǔ)設(shè)施級運維需求,與同行分享和探討。
一 基礎(chǔ)設(shè)施維護需求
1數(shù)據(jù)中心資源組成
行業(yè)內(nèi)將數(shù)據(jù)中心運行資源分為兩個級別:I和業(yè)務(wù)級、基礎(chǔ)設(shè)施級?;A(chǔ)設(shè)施級運行資源包括四個要素:建筑、物理基礎(chǔ)設(shè)施、基礎(chǔ)設(shè)施監(jiān)控/維修工具備件、運維團隊。數(shù)據(jù)中心資源圖如圖1所示。
2什么是基礎(chǔ)設(shè)施級運維需求
為提供連續(xù)不中斷服務(wù),數(shù)據(jù)中心基礎(chǔ)設(shè)施應既能實現(xiàn)正常運行,又同時支持故障快速發(fā)現(xiàn)定位和修復,保持功能不中斷:
?、俳ㄖ拔锢砘A(chǔ)設(shè)施應有監(jiān)視維護條件,支持快速修復故障,同時正常工作;
?、诒O(jiān)控系統(tǒng)功能全面,運行正常,迅速發(fā)現(xiàn)故障和異常;
?、劬S修工具備品資源便利好用,支持維護工作開展;
?、芑A(chǔ)設(shè)施運維團隊可順利完成現(xiàn)場工作。
3基礎(chǔ)設(shè)施級運維需求的實現(xiàn)
通常在四個層次上實現(xiàn):
?、僬军c級可維護:通過完全獨立的多站點,實現(xiàn)數(shù)據(jù)中心級并行維護;常見方式有同城備份中心、異地災備中心、兩地三中心等;
?、谙到y(tǒng)級可維護:通過系統(tǒng)架構(gòu)上設(shè)備和路徑冗余,實現(xiàn)專業(yè)系統(tǒng)的并行維護,如2N系統(tǒng)、雙冷源空調(diào)系統(tǒng)、柴油發(fā)電系統(tǒng)等應急電源,TIA-942、GB50174-2017等主要數(shù)據(jù)中心標準對此有具體描述;
?、酃δ芗壙删S護:各專業(yè)系統(tǒng)、設(shè)備和機組具備正常工作條件、可運維功能可以正確實現(xiàn);主要通過系統(tǒng)設(shè)計、安裝、調(diào)試實現(xiàn);
?、懿考壙蛇\維:設(shè)備設(shè)施的部件功能可被調(diào)整、監(jiān)控、清洗、更換。具體主要散見各專業(yè)系統(tǒng)設(shè)計安裝規(guī)范,通過安裝實現(xiàn);
?、葸\維團隊支持運維:運維團隊有合格資質(zhì),人力充足,能貼近設(shè)備現(xiàn)場長期工作,監(jiān)控、維護工具齊全易用?! ?/span>
上述5個方面中,功能級、部件級、基礎(chǔ)設(shè)施運維團隊的可維護性要求常常被忽略,出現(xiàn)各種問題。
二 基礎(chǔ)設(shè)施運維團隊
常見問題是,重視IT技術(shù)、業(yè)務(wù)運維團隊需要,忽視基礎(chǔ)設(shè)施運維團隊的需要,把電工值班室作為運維團隊唯一工作區(qū),功能空間規(guī)劃面積不足,布局不合理,使用不便?! ?/span>
一線基礎(chǔ)設(shè)施運維值守團隊需貼近設(shè)備現(xiàn)場并長期工作,工作形式多樣,現(xiàn)場工作區(qū)應解決下列功能面積:
?、僖痪€監(jiān)控區(qū):關(guān)鍵設(shè)施監(jiān)控區(qū)(電工值班室)、建筑設(shè)施監(jiān)控區(qū)(安防消防值班室);
?、诂F(xiàn)場團隊工作區(qū):簡單會議/培訓、廠商接待/臨時工作;
?、垡痪€管理辦公區(qū):生產(chǎn)輔助管理、辦公、茶水區(qū)、維修清掃區(qū);
?、軋D紙文檔區(qū):各專業(yè)竣工圖紙資料等。此外,應鄰近建筑入口、高低壓供電設(shè)備區(qū),建筑邊角區(qū)位置
三 運維監(jiān)控設(shè)備和維修工具
常見問題是:對各類運維監(jiān)控設(shè)備總量及所需用電量、建筑空間估計不足,未設(shè)專用設(shè)備機房,配電結(jié)構(gòu)不夠安全等。特別是有可能UPS設(shè)備容量、配電系統(tǒng)結(jié)構(gòu)變化,會導致建設(shè)中的大量修改?! ?/span>
某A級中型數(shù)據(jù)中心基礎(chǔ)設(shè)施監(jiān)控系統(tǒng)與運維工具如表1所表示?!?/span>
建議安排專用機房和倉庫,配備專用UPS系統(tǒng)和獨立配電結(jié)構(gòu)。
四 可維護的建筑可能
最常見問題是支持人員和貨物不可達設(shè)備維修部位,或缺乏水電等維修支持資源。
1可達性
建筑應支持人員和貨物設(shè)備可達安裝位置需求具體見表2。
2清洗維護需求
建筑應提供場地、水、電、排水等維修資源支持,滿足設(shè)備部件清洗維護需要,具體見表3。
五 物理基礎(chǔ)設(shè)施設(shè)備運維需求
建設(shè)中的常見問題是缺少操作間距和不可維護,如設(shè)備部件安裝打不開門,不能清洗、更換、測量等問題。物理基礎(chǔ)設(shè)施設(shè)備的運維需求見表4?! ?/span>