為確保公司機房安全與穩(wěn)定,以保證正常運行為宗旨,按照“預(yù)防為主,積極處置”的原則,本著建立一個有效處置突發(fā)事件,建立統(tǒng)一指揮、職責(zé)明確運轉(zhuǎn)有序、反應(yīng)迅速處置有力的機房安全體系的目標(biāo),特制定本預(yù)案。
???????
??????? 一、機房日常維護
??????? 1、建立健全機房管理制度
??????? ?(1)在正常工作日內(nèi),財務(wù)部信息組(以下簡稱信息組)人員負責(zé)對機房進行監(jiān)控,主要職責(zé)是:巡視網(wǎng)絡(luò)設(shè)備及系統(tǒng)的運行情況,發(fā)生異常情況及時處理,消除網(wǎng)絡(luò)故障隱患。
??????? ?(2)節(jié)假日期間信息組人員輪流值班,負責(zé)處理有關(guān)異常情況。
??????? ?(3)機房采取來人來訪登記制度,未經(jīng)允許,無關(guān)人員不得進入公司機房區(qū)域。
??????? 2、機房內(nèi)嚴(yán)格采取防雷、防火、防塵、防靜電等措施以及機房入口處24小時監(jiān)控錄像等措施。
??????? 3、認真做好數(shù)據(jù)備份工作,定期做一次數(shù)據(jù)庫完全備份,每月檢查服務(wù)器運行和備份情況。
??????? 4、信息組對機房的主要網(wǎng)絡(luò)設(shè)備(路由器、主干交換機等)進行工作時間內(nèi)全程監(jiān)控,發(fā)現(xiàn)異常情況應(yīng)及時進行處理,確保整個公司網(wǎng)絡(luò)的正常運行。
???????
??????? 二、機房突發(fā)事件應(yīng)急處置方案
??????? 1、電源系統(tǒng)應(yīng)急預(yù)案
??????? ?(1)定期檢查機房供電設(shè)備的運行狀況和電路線纜器材情況,當(dāng)發(fā)生下列突發(fā)事件時,按照以下方案進行處置:
??????? ?(2)當(dāng)機房發(fā)生突然停電或是電源異常時。首先應(yīng)和相關(guān)人員聯(lián)系確認正常停電以及預(yù)計停電時間。檢查不間斷電源的電池可供電時間,確保設(shè)備正常運行,如遇到突然斷電,應(yīng)及時將空調(diào)等不在UPS電源供電范圍內(nèi)的設(shè)備及時斷電,預(yù)防突然來電時瞬間電流過大導(dǎo)致設(shè)備損壞等現(xiàn)象。
??????? ?(3)當(dāng)確定停電時間超出機房UPS承載范圍后,首先確定停電的范圍以及受影響的設(shè)備范圍。并及時通知各部門做好停電應(yīng)急準(zhǔn)備。然后通知機房管理人員和系統(tǒng)管理人員到達現(xiàn)場,做好各設(shè)備的電源停電準(zhǔn)備。在UPS供電電量僅剩10%之后,嚴(yán)格按操作手冊停掉各服務(wù)器的電源,最后停核心交換機和路由器,等待電力恢復(fù)。
??????? (4)當(dāng)確定停電原因是在本身供電系統(tǒng)范圍內(nèi),立即匯報給負責(zé)領(lǐng)導(dǎo),并及時聯(lián)系相關(guān)維護人員達到現(xiàn)場檢修。對于恢復(fù)時間無法預(yù)計的,要及時通知各部門做好停電應(yīng)急準(zhǔn)備。
??????? (5)恢復(fù)供電后,嚴(yán)格按照操作程序逐步恢復(fù)機房設(shè)備和UPS的供電,以防瞬間電流過大造成設(shè)備損壞。
??????? 2、網(wǎng)絡(luò)和服務(wù)器絡(luò)系統(tǒng)應(yīng)急預(yù)案
??????? (1)發(fā)生網(wǎng)絡(luò)故障時,首先檢查機房設(shè)備情況,確定網(wǎng)絡(luò)故障的原因。
??????? (2)確認原因后,首先啟動備用線路和設(shè)備,保證網(wǎng)絡(luò)的正常運行。然后聯(lián)系網(wǎng)絡(luò)管理人員,及時處理和排除故障。
??????? (3)當(dāng)確認原因為短時間無法恢復(fù),應(yīng)該及時向負責(zé)領(lǐng)導(dǎo)匯報。然后通知各部門做好應(yīng)急準(zhǔn)備。然后再聯(lián)系維護人員,及時處理故障。
??????? (4)當(dāng)人為或病毒破壞的故障發(fā)生時,具體按以下順序進行:判斷破壞的來源及性質(zhì),斷開影響安全與穩(wěn)定的設(shè)備,斷開與破壞來源的物理網(wǎng)絡(luò)連接,跟蹤并鎖定破壞的來源和其他網(wǎng)絡(luò)用戶信息,修復(fù)被破壞的信息,恢復(fù)系統(tǒng)。
??????? (5)發(fā)生服務(wù)器系統(tǒng)故障后,應(yīng)立即電話向相關(guān)領(lǐng)導(dǎo)匯報情況,及時組織啟動備份服務(wù)器系統(tǒng),由備份服務(wù)器接管相關(guān)業(yè)務(wù)應(yīng)用,同時安排人員將故障服務(wù)器脫離網(wǎng)絡(luò),保存系統(tǒng)狀態(tài)不變,保護原始數(shù)據(jù)。
??????? ?在確認安全的情況下,重新啟動故障服務(wù)系統(tǒng):若重啟系統(tǒng)成功,則檢查數(shù)據(jù)丟失情況,利用備份數(shù)據(jù)恢復(fù);若重啟失敗,立即相關(guān)技術(shù)人及時處理。
??????? ?處置結(jié)束后,技術(shù)人員應(yīng)將處理過程記錄下來,以方便日后對此問題的處理。
??????? 3、消防和防雷應(yīng)急預(yù)案
??????? ?(1)上班工作時間發(fā)生火警,還在機房工作的人員應(yīng)及時緊急撤離,并立刻撥打119報警。在確保自身安全的情況下,應(yīng)盡量使用滅火器進行滅火,減少電子設(shè)備的損壞。同時采取關(guān)閉電源總閘等措施,盡量減少可能造成的損失和破壞。
??????? ?(2)非工作時間或節(jié)假日休息時間值班人員發(fā)現(xiàn)火情后,要立刻撥打119報警,并立刻通知相關(guān)部門和領(lǐng)導(dǎo),做好火災(zāi)的處置工作。
??????? ?(3)火情結(jié)束之后,機房相關(guān)人員應(yīng)全體趕赴現(xiàn)場,并向負責(zé)領(lǐng)導(dǎo)匯報。同時立即聯(lián)系相關(guān)單位,及時評估事故損失情況,研討恢復(fù)網(wǎng)絡(luò)系統(tǒng)正常運行的最佳解決方案。
??????? ?(4)遇雷暴天氣或接上級部門雷暴氣象預(yù)警,應(yīng)關(guān)閉所有服務(wù)器,切斷電源,暫停內(nèi)部計算機網(wǎng)絡(luò)工作。雷暴天氣結(jié)束后,及時開通服務(wù)器,恢復(fù)內(nèi)部計算機網(wǎng)絡(luò)工作。因雷擊造成的損失,應(yīng)及時進行核實、報損,并將詳細情況向部門領(lǐng)導(dǎo)匯報。
??????? 4、自然災(zāi)害和盜搶應(yīng)急預(yù)案
??????? (1)發(fā)生自然災(zāi)害后,首先應(yīng)該組織人員撤離現(xiàn)場。當(dāng)確認災(zāi)害不會造成人員傷害后,在回到機房檢查設(shè)備,立刻向上級領(lǐng)導(dǎo)匯報,并聯(lián)系相關(guān)網(wǎng)絡(luò)和設(shè)備廠家,積極做好災(zāi)后恢復(fù)工作,確保在最短時間內(nèi)恢復(fù)機房正常運行。
??????? (2)發(fā)生盜搶事件后,要保護好現(xiàn)場然后報警,并向領(lǐng)導(dǎo)匯報情況。待現(xiàn)場處理完畢后,要組織相關(guān)人員估計損毀情況,并聯(lián)系相關(guān)網(wǎng)絡(luò)和設(shè)備廠家,積極做好恢復(fù)工作。
???????
???????