數(shù)據(jù)中心機房監(jiān)控系統(tǒng)主要是對機房內(nèi)設備和環(huán)境進行集中監(jiān)控和管理,,通過采集機房運行中的各種數(shù)據(jù)參數(shù),,來判斷是否出現(xiàn)異常,對數(shù)據(jù)中心機房具有重要意義,。機房監(jiān)控系統(tǒng)包含多個方面,,而不只是簡單的視頻監(jiān)控,理論上,,機房任何區(qū)域都有出現(xiàn)問題的可能,,監(jiān)控系統(tǒng)的覆蓋性一定程度上決定機房運行的穩(wěn)定性。下面就來詳細介紹一下數(shù)據(jù)中心機房的三大監(jiān)控系統(tǒng),,以及它們各自具有的功能,。
(一)數(shù)據(jù)中心機房之“設備監(jiān)控系統(tǒng)”
數(shù)據(jù)中心機房里的設備成千上萬,,對這些設備的運行情況進行監(jiān)控非常必要,,比如服務器運行的CPU內(nèi)存參數(shù),網(wǎng)絡設備的端口流量,,業(yè)務層面的監(jiān)控等等,,設備層面的監(jiān)控就更為復雜了,需要對設備的各種運行參數(shù)比較清楚,,因此一般設備的監(jiān)控系統(tǒng)都采用設備廠家提供的監(jiān)控軟件或者標準的第三方軟件來進行管理,。
(1)通過這些監(jiān)控軟件,7*24小時對設備運行的各種參數(shù)進行監(jiān)控,一旦發(fā)現(xiàn)有異常就發(fā)出告警,。
(2)告警的方式也比較多,,可以打印到日志主機上,可以通過短信發(fā)送到運維人員的手機上,,也可以通過軟件系統(tǒng)自行嘗試修復,。
(3)監(jiān)控的軟件做的是否完善將決定故障出現(xiàn)時,能否給出告警,,所以涉及設備的監(jiān)控往往是在不斷完善的過程,,很多監(jiān)控參數(shù)都是經(jīng)驗之道,甚至是歷史的教訓,,只有通過不斷地改進,、優(yōu)化,才能將發(fā)生的風險及時發(fā)現(xiàn),,當然要做到所有的故障都可能提前預知,、發(fā)現(xiàn),是非常困難的,。
(4)有時的故障可能無任何征兆,,尤其是硬件故障,會突然出現(xiàn),,而往往監(jiān)控系統(tǒng)是無法監(jiān)測到硬件級別的,、元器件的故障。
(二)數(shù)據(jù)中心機房之“視頻監(jiān)控系統(tǒng)”
和其它的商務建筑一樣,,數(shù)據(jù)中心機房也需要部署視頻監(jiān)控系統(tǒng)。視頻監(jiān)控主要是對進出數(shù)據(jù)中心機房的人員進行監(jiān)控,,在數(shù)據(jù)中心機房的出入口要部署攝像頭,,在數(shù)據(jù)中心機房內(nèi)部樓道,,重要的機房入口都要部署,。
在有的非常重要業(yè)務的機房內(nèi),有時也要部署攝像頭,,以便防止一些人員的惡意操作或者誤操作,,發(fā)現(xiàn)這些異常時及時制止,以防止給數(shù)據(jù)中心機房業(yè)務帶來影響,。數(shù)據(jù)中心機房里的很多設備,、儀器都是非常昂貴的,因為人為的原因?qū)е聯(lián)p壞的情況是非常多見的,,還有就是防止一些偷盜行為,。比如數(shù)據(jù)中心機房里的光模塊,一個光模塊,,尤其是40G/100G光模塊,,一個都要數(shù)千元,,順手拿出去幾個,轉(zhuǎn)手可以獲利上萬元,。
有了視頻監(jiān)控系統(tǒng),,就能最大限度地避免這些行為出現(xiàn),或者在出現(xiàn)后可以通過這些監(jiān)控錄像進行分析,、追責,,這些視頻錄像是重要的證據(jù),所以視頻監(jiān)控系統(tǒng)是數(shù)據(jù)中心機房不可缺少的一部分,,有的數(shù)據(jù)中心機房除了視頻的監(jiān)控,,還要在數(shù)據(jù)中心機房出入做好人員訪問登記工作,對外來人員進行管理,,避免放入一些惡意分子,。
(三)數(shù)據(jù)中心機房之“煙霧溫濕監(jiān)控系統(tǒng)”
數(shù)據(jù)中心機房一樣怕火,一旦發(fā)生火災對于數(shù)據(jù)中心機房來說就是毀滅性的打擊,。以往也出現(xiàn)過一些慘痛的教訓,,所以對于放火,數(shù)據(jù)中心機房且不可大意,。數(shù)據(jù)中心機房和其它的建筑不同,,內(nèi)部有太多的電子設備,并不適用于噴淋系統(tǒng),,只能采用干粉滅火或者惰性氣體滅火,。
當機房內(nèi)的煙霧濃度超過了報警器設定的門限,,即觸發(fā)監(jiān)控系統(tǒng),,及時將火滅除,除了煙霧,,機房內(nèi)的溫度和濕度也是需要監(jiān)控的重要部署,。數(shù)據(jù)中心機房內(nèi)部要盡量保持恒溫恒濕,但實際上在數(shù)據(jù)中心機房內(nèi)部會有局部的溫度死角,,長期以往會大大降低電子設備的使用壽命,,通過在數(shù)據(jù)中心機房內(nèi)多個區(qū)域部署溫濕度傳感器,建立起溫濕度的監(jiān)控網(wǎng)絡,,就可以及時地發(fā)現(xiàn)局部區(qū)域過溫過濕的情況,,在一些空氣污染較為嚴重的地方,還可以部署空氣清潔度監(jiān)測的設備,,數(shù)據(jù)中心機房設備運行在污染嚴重的環(huán)境里,,容易造成靜電、電容擊穿器件等故障,為何我們要求數(shù)據(jù)中心機房設備要周期性地進行除塵就是這個道理,,本身灰塵中就含有不少的污染物,。
數(shù)據(jù)中心機房在高速的發(fā)展,各種新技術層出不窮,,也讓數(shù)據(jù)中心機房運行變得愈加復雜,,這給監(jiān)控系統(tǒng)也帶來了不小的挑戰(zhàn),如何通過監(jiān)控系統(tǒng)及時發(fā)現(xiàn)運行風險,,是監(jiān)控系統(tǒng)關心的永恒話題,。
盡管數(shù)據(jù)中心機房有各種各樣的監(jiān)控系統(tǒng),但是可以確定的是監(jiān)控系統(tǒng)無法提前發(fā)現(xiàn)所有的故障,,尤其是設備級別的故障,,但是通過完善的監(jiān)控系統(tǒng)的確可以大大避免很多故障。就算監(jiān)控系統(tǒng)沒有在發(fā)生故障時,,給出告警,,但是在事后故障分析中,監(jiān)控系統(tǒng)的各種技術參數(shù)和記錄依然是可供分析的重要資料,,通過對這些監(jiān)控記錄很可能可以找出故障的原因,。 監(jiān)控系統(tǒng)的作用就是將歷史經(jīng)驗、教訓轉(zhuǎn)化為一些數(shù)據(jù)參數(shù),,然后采集數(shù)據(jù)中心機房里的各種數(shù)據(jù)信息進行對比,,如果發(fā)現(xiàn)異常,就及時給出告警,。數(shù)據(jù)越豐富,,監(jiān)控系統(tǒng)的功能就越強大。
總結:
不要以為一個數(shù)據(jù)中心機房不是部署了監(jiān)控系統(tǒng)就可以高枕無憂了,,任何的系統(tǒng)都有漏洞,,何況是監(jiān)控系統(tǒng),所以數(shù)據(jù)中心機房運維人員還要在日常的工作中,,多檢查,,多分析,及時發(fā)現(xiàn)隱患,,如果監(jiān)控系統(tǒng)未能發(fā)現(xiàn),,那么想辦法將這些隱患的判斷加到監(jiān)控系統(tǒng)中,,使監(jiān)控系統(tǒng)越來越完善,,決不能允許相同的錯誤,連續(xù)犯兩次,。
來源:機房環(huán)境監(jiān)控 http://youring.cn/ 本文采集于網(wǎng)絡,,如有問題有聯(lián)系刪除
專線:劉剛 13911133352
E-mail:[email protected]
北京金恒智能系統(tǒng)工程技術有限責任公司 版權所有 Copyright 2007-2020 by Create-china.com.cn Inc. All rights reserved.
法律聲明:未經(jīng)許可,,任何模仿本站模板、轉(zhuǎn)載本站內(nèi)容等行為者,,本站保留追究其法律責任的權利,!
電話:86+10-62104277/2248/4249 傳真:86+10-62104193-819 京ICP備10010038號-2網(wǎng)站XML
智慧機房
在線體驗