第一篇:機房用電應(yīng)急預(yù)案
1,機房意外停電后,首先確定停電的范圍以及受影響的設(shè)備范圍。2,確認停電的范圍為本樓或本校區(qū),應(yīng)立即打后勤管理處電話匯報。估算電力可能恢復(fù)的時間。并通知網(wǎng)絡(luò)中心領(lǐng)導(dǎo)。3,如果確認停電的時間為1個小時內(nèi),可以在UPS正常供電的時間內(nèi),等到電力恢復(fù),如果不能確認在2小時內(nèi)恢復(fù),立即匯報給機房電源維護負責(zé)人和中心機房各設(shè)備的負責(zé)人到達現(xiàn)場。做好各設(shè)備的電源停電準備,在UPS供電達1.5小時后,嚴格殷實操作手冊停掉存儲和各應(yīng)用服務(wù)器的電源。最后停核心交換機和路由器,等待電力恢復(fù)。電力恢復(fù)供電后轉(zhuǎn)第七條執(zhí)行。如果確認停電的范圍僅在于本機房電源故障。立即匯報給機房電源維護負責(zé)人。4,機房維護負責(zé)人將掉電的電源柜總空開和分空開的狀態(tài)處于下電狀態(tài)。并向主管領(lǐng)導(dǎo)匯報。馬上聯(lián)系相關(guān)廠家,如有可能請廠家立即到現(xiàn)場支持。5,將掉電的所有設(shè)備電源處于下電狀態(tài)。以防止電源柜加電對設(shè)備的沖擊。6,等各廠家和相關(guān)人員到齊后,商議設(shè)備恢復(fù)時間因注意的事項。并形成相關(guān)文檔。7,電力室恢復(fù)供電后,先不要急于給電源柜加電,等待10-20分鐘后,再開始給電源柜加電,以防止供電不穩(wěn)定或再次掉電。8,供電正常后,確定設(shè)備處于下電狀態(tài)后,打開電力柜的總控開。9,根據(jù)設(shè)備加電順序,啟動分項空開。10,設(shè)備加電順序,IP交換機和SAN交換機正常后再給存儲加電,存儲狀態(tài)檢查正常后,啟動主機(以上各設(shè)備務(wù)必按操作手冊的啟動順序上電).11,設(shè)備啟動正常后,開始啟動數(shù)據(jù)庫。12,數(shù)據(jù)庫啟動正常后,開始啟動中間件服務(wù)器。13,中間件服務(wù)器正常后,啟動應(yīng)用程序。
2,核心機房電力的保障一直是維護體系的頭等重要事項,通過實施應(yīng)急發(fā)電演練,建立了可靠的應(yīng)急預(yù)案機制,最大限度的降低電源中斷對網(wǎng)絡(luò)傳輸質(zhì)量的影響。現(xiàn)分享核心機房電源中斷應(yīng)急預(yù)案,希望分公司盡快建立一套統(tǒng)一指揮、職責(zé)明確、反應(yīng)迅速、處置有力的機房安全保障機制。3,組織架構(gòu): 4,責(zé)任領(lǐng)導(dǎo)、工程維護、網(wǎng)絡(luò)監(jiān)控、網(wǎng)絡(luò)運維、質(zhì)量管理等相關(guān)人員。
5,機房電源系統(tǒng)說明: 6,1.機房電力是兩路三相四線制供電,進線線纜規(guī)格為:RVV50*4+16*1銅芯護套線。
7,2.機房電源系統(tǒng)采用三級防雷系統(tǒng),三級防雷分別位于電源進線端、UPS輸入前端。
8,3.機房現(xiàn)有兩臺60KVA-UPS電源,均處于正常運行狀態(tài)。
9,4.機房現(xiàn)有設(shè)備機柜已編號,均通過UPS電源和市電供電,每個機柜有獨立的20A空氣開關(guān)。空調(diào)、墻壁插座開關(guān)、應(yīng)急燈、照明等都是單獨空開接市電。
10,5.運行中的UPS電源所帶負荷,在逆變運行狀態(tài)下能正常工作約4小時(已經(jīng)過UPS放電測試)。
11,一.核心機房電源中斷預(yù)案
12,1.在接到停電通知的情況下: 13,1)計劃性停電通知要確保綜合部、工維機房管理部對口人接到通知(提前將對口聯(lián)系人備案在物業(yè)處),機房管理員接到計劃停電通知后,升級到調(diào)度中心進行信息發(fā)送,同步進行郵件通知相應(yīng)應(yīng)急小組成員。并與負責(zé)組長及責(zé)任領(lǐng)導(dǎo)電話告知,確保已經(jīng)接收到本次停電的時間及可能發(fā)生的情況。
14,2)維部進行發(fā)電應(yīng)急預(yù)案小組成員通知,提前做好機房發(fā)電預(yù)案要求的準備工作,將相應(yīng)的發(fā)電機、連接線、人員安排到位,各司其職,隨時待命現(xiàn)場,做發(fā)電準備工作。確保停電時刻的電力安全及機房用電的保障措施,提前調(diào)度安排好相應(yīng)人員做好保障用電的措施。
15,3)計劃停電時間開始后,馬上啟動應(yīng)急發(fā)電操作,按照機房發(fā)電操作步驟實施階梯供電的步驟,恢復(fù)市電保障。并進行現(xiàn)場值守及設(shè)備工作確認,確保全部正常后電話告知調(diào)度中心及維護體系領(lǐng)導(dǎo)。
16,2.在沒有接到任何通知,突然發(fā)生停電的情況下:
17,確認停電線路,停電時刻,停電時間等要素,啟動核心機房發(fā)電應(yīng)急預(yù)案。
18,1)值班網(wǎng)管工作流程:
19,⑴值班網(wǎng)管監(jiān)控到核心機房停電,第一時間告知工維部、網(wǎng)絡(luò)部、運維部應(yīng)急小組組長。信息傳達到工維部機房管理員(一主一備),告知停電開始時間。
20,要求在停電5分鐘內(nèi)將消息傳達到調(diào)度中心,各應(yīng)急小組組長。如無法聯(lián)系上,進行升級到責(zé)任領(lǐng)導(dǎo)-工維部經(jīng)理經(jīng)理處。21,⑵網(wǎng)管將停電信息電話傳達后,進行調(diào)度派單,確保全部的應(yīng)急小組成員都收到本次故障停電的信息。然后進行機房中設(shè)備的檢查,包括:UPS設(shè)備主機、各核心設(shè)備、匯聚設(shè)備、服務(wù)器、語音系統(tǒng)等。檢查是否受影響。同時啟動機房降溫措施(降溫方案:初步為加裝抽排風(fēng)設(shè)備、增加大風(fēng)扇排風(fēng)形成熱量流動降溫)22,⑶實時監(jiān)控設(shè)備及UPS工作情況,包括:電量下降情況,設(shè)備工作正常情況,每15分鐘通報一次電量情況。
23,2)運維部應(yīng)急工作流程:
24,⑴運維應(yīng)急同事接到故障通告后,第一時間往停電現(xiàn)場趕,到現(xiàn)場配合網(wǎng)管/工維部門進行設(shè)備儀器的檢查、客服語音系統(tǒng)的保障,應(yīng)急發(fā)電的協(xié)助。
25,⑵現(xiàn)場配合進行機房降溫散熱措施實施,實時檢查網(wǎng)絡(luò)設(shè)備的工作情況。
26,3)運營質(zhì)量管理應(yīng)急工作流程:
27,⑴調(diào)度中心值班人員接到網(wǎng)管監(jiān)控調(diào)度信息后,第一時間將故障信息記錄并發(fā)故障通告到相關(guān)應(yīng)急成員,并電話通知各應(yīng)急小組組長是否知悉。
28,⑵進行客服調(diào)度系統(tǒng)的設(shè)備工作運行系統(tǒng)檢查,特別語音系統(tǒng)級坐席電腦,是否有問題,如發(fā)現(xiàn)工作系統(tǒng)有異常,及時與運維應(yīng)急小組成員溝通,進行檢查處理。
29,⑶實時關(guān)注故障工單流程進度登記,配合應(yīng)急小組進行人員調(diào)度通告。30,4)工維部應(yīng)急工作流程:
31,⑴機房管理員第一時間往停電現(xiàn)場趕,同時進行電話溝通供電公司、物業(yè)方等,咨詢停電原因,是屬于計劃性還是突發(fā)性停電,預(yù)計停電時長,將咨詢清楚的結(jié)果反饋到應(yīng)急小組成員中,電話聯(lián)系物業(yè)溝通好需要發(fā)電需求申請。
32,⑵工維應(yīng)急小組組長接到時間后第一時間往停電現(xiàn)場趕,同時進行發(fā)電應(yīng)急小組成員調(diào)度,安排第一時間到場工作開展,并升級通報告知主管領(lǐng)導(dǎo),對口集團維護中心上報信息。
33,⑶工維應(yīng)急小組成員接到停電時間后第一時間往停電現(xiàn)場趕,要求30分鐘內(nèi)必須到場(住機房附近的人員往現(xiàn)場去,較遠同事可以進行打車往現(xiàn)場去),先行到處同事配合網(wǎng)管、運維同事啟動做好應(yīng)急發(fā)電前的準備:連接線布放、接續(xù)、發(fā)電機發(fā)電前檢測油/電/水路檢查,確保正常。確保一切就緒后,確認可以進行發(fā)電操作后,按照發(fā)電操作流程進行發(fā)電恢復(fù)市電。
34,⑷網(wǎng)管將監(jiān)控到停電的相應(yīng)信息及級別同步發(fā)送到運營質(zhì)量管理部調(diào)度崗,由調(diào)度崗將相應(yīng)信息進行工維、運維、網(wǎng)絡(luò)關(guān)聯(lián)同事進行信息告知,同時報工維主管領(lǐng)導(dǎo)知悉。
35,5)應(yīng)急機房發(fā)電操作流程:
36,⑴機房用電系統(tǒng)包括四方面:空調(diào)制冷、主/備UPS主機、照明系統(tǒng)、客服調(diào)度系統(tǒng)。37,⑵發(fā)電前考慮4方面系統(tǒng)設(shè)備用電功率情況,為保障發(fā)電機帶動的正常,不能進行同步供電,要區(qū)分優(yōu)先恢復(fù)的步驟實施,確認發(fā)電機的工作正常。在發(fā)電前將需要供電的“空調(diào)制冷、主/備UPS主機、照明系統(tǒng)、客服調(diào)度系統(tǒng)”的市電輸入主開關(guān)關(guān)閉。防止同步啟動時發(fā)電機的無法供電保證。
38,⑶啟動發(fā)電機,檢測發(fā)電輸出電流通斷,待發(fā)電機運行穩(wěn)定后。
39,第一步啟動空調(diào)制冷系統(tǒng)的市電輸入開關(guān),運維應(yīng)急小組成員重新啟動空調(diào)主機(空調(diào)因為市電恢復(fù)后需要重新啟動)觀察空調(diào)制冷工作是否正常。
40,第二步啟動主UPS設(shè)備的市電輸入開關(guān),觀察發(fā)電機運行穩(wěn)定情況,主UPS主機工作穩(wěn)定情況,網(wǎng)絡(luò)設(shè)備的工作正常與否。
41,第三步啟動客服系統(tǒng)的市電輸入開關(guān),包括(客服坐席電腦、UPS設(shè)備、空調(diào)制冷等),觀察發(fā)電機運行穩(wěn)定情況,設(shè)備恢復(fù)工作情況。
42,第四步啟動備UPS設(shè)備、市電照明的市電輸入開關(guān),觀察發(fā)電機運行穩(wěn)定情況,備UPS主機工作穩(wěn)定情況,網(wǎng)絡(luò)設(shè)備的工作正常與否。
43,⑷發(fā)電機啟動,市電輸入正常后,網(wǎng)管將降溫系統(tǒng)的抽排風(fēng)設(shè)備關(guān)閉,與運維同事進行所有設(shè)備的運行進行全面的檢查,確保設(shè)備已經(jīng)是運行正常。
44,⑸發(fā)電機發(fā)起市電正常后,工維應(yīng)急小組安排專人現(xiàn)場值守,及時關(guān)注發(fā)電機油量情況,同時與油品供應(yīng)商確認油品配送要求及時間要求,并實時與供電部門確認市電恢復(fù)時間。
45,6)停電過程中突發(fā)事項預(yù)防: 46,⑴網(wǎng)管在停電時進行機房確認運行中的UPS工作組、設(shè)備組工作狀態(tài)。主/備UPS工作切換是否正常,在市電中斷時UPS是否已經(jīng)開始進行供電保護。
47,⑵值班網(wǎng)管對機房中的所有設(shè)備進行全面檢查,確保所有的設(shè)備已經(jīng)是有主備供電,市電中斷后UPS已經(jīng)正常保障設(shè)備工作。同時對機房的溫度進行觀察,溫度是否突然升高。
48,⑶停電后,UPS處于逆變工作狀態(tài),當班人員要每隔15分鐘觀察一次UPS的蓄電池容量、帶負荷情況、機房環(huán)境溫度,盡量使蓄電池容量大于60%,帶負荷小于85%(因為已經(jīng)有自購發(fā)電機應(yīng)急,盡快要求短時間發(fā)起電,減少UPS的放電過度)。
49,⑷發(fā)現(xiàn)機房環(huán)境溫度大于26℃。當以上指標不能保證時,要及時向機房管理員匯報,同時上報責(zé)任領(lǐng)導(dǎo)知悉,網(wǎng)管預(yù)案小組成員經(jīng)過慎重討論,適時采取關(guān)閉不必要網(wǎng)絡(luò)的網(wǎng)絡(luò)設(shè)備、加強通風(fēng)降溫等措施盡量延長關(guān)鍵設(shè)備運行時間
50,三.應(yīng)急發(fā)電機的油品保障措施
51,發(fā)電機正常啟動后,需要做到油品及時供應(yīng),具體保障措施方案為: 52,1.確認多家供應(yīng)商進行油品供應(yīng),簽署油品供應(yīng)協(xié)議,確保油品的供應(yīng)充足。
53,2.油品的供應(yīng)以應(yīng)急小組成員通知后開始準備,協(xié)議要求是6小時內(nèi)送貨到場。54,3.只要進行發(fā)電一小時以上,則必須在停止發(fā)電后補充滿油品,確保發(fā)電機隨時都是滿配油品保障中。
55,4.油品的零購是屬于公安部門的監(jiān)管,所以分公司提前將資料向公安部門報備,在公司因為特殊原因有零購油品需求,在公安部門已經(jīng)有分公司備案資料下,每次使用零購油品進行公安部門蓋章申請。可以隨時進行購買。
56,四.恢復(fù)交流電后的處理措施
57,1.打開電力室和網(wǎng)絡(luò)機房空調(diào)市電開關(guān),并將調(diào)節(jié)溫度設(shè)定為20℃。首先恢復(fù)機房制冷系統(tǒng)的正常工作。
58,2.等供電穩(wěn)定后(一般在恢復(fù)市電10分鐘后),閉合主/備UPS設(shè)備空氣開關(guān),恢復(fù)給主/備UPS交流供電。觀察并確認UPS轉(zhuǎn)換為交流穩(wěn)壓和浮充狀態(tài)。
59,3.閉合客服系統(tǒng)的主空氣開關(guān),恢復(fù)客服系統(tǒng)的交流供電,并觀察設(shè)備工作運行情況。
60,4.觀察10分鐘后,確保所有網(wǎng)絡(luò)及設(shè)備、UPS設(shè)備組工作穩(wěn)定后,將發(fā)電機停止發(fā)電,并將情況報告給調(diào)度及主管領(lǐng)導(dǎo)。
61,5.應(yīng)急小組將發(fā)電的物資進行收拾整理存放好,并進行記錄發(fā)電機的工作時間及油/水/電路的切斷。機房的降溫設(shè)備的關(guān)閉確認及物資收拾整理存放好。62,6.將處理情況做詳細書面記錄,請相關(guān)人員簽字確認并報集團公司信息化系統(tǒng)管理平臺上填寫相關(guān)記錄。
63,五.發(fā)電機的日常維護措施
64,對于柴油發(fā)電機來說,由于它不是日常的主要供電設(shè)備,所以日常的維護保養(yǎng)主要包括以下幾個方面:
65,1.定期檢查和更換柴油過濾器和機油過濾器
66,2.定期清理檢查進氣過濾器,并在固定的周期進行更換(或者根據(jù)現(xiàn)場的工況和進氣過濾器的透氣程度進行更換)67,3.定期檢查和清理電池組接線柱,保持接線柱清潔
68,4.定期檢查電池組的充電狀態(tài),保證良好的充電效果
69,5.定期檢查風(fēng)扇皮帶的狀態(tài),確保無損傷和處于正常的松緊度
70,6.定期檢查冷卻液的狀態(tài),確保滿足要求
71,7.定期檢查或者更換柴油機機油,確保油位正常
72,8.冬天寒冷季節(jié)要確保機組預(yù)熱裝置正常工作,以便在需要啟動發(fā)電機時能正常啟動
1.機房工作人員應(yīng)具備用電常識,了解機房供電布局、開關(guān)位置、設(shè)備供電來源等,機房工作時間注意用電安全和自身安全。
2.機房工作人員不得私自更改設(shè)備供電線路,對自己所管設(shè)備進行斷電操作時不能影響其他設(shè)備供電,新增設(shè)備需要供電應(yīng)由機房電力管理員統(tǒng)一調(diào)配。
3.機房禁止使用高溫、熾熱、產(chǎn)生火花的大功率或危險設(shè)備,確需使用電焊、電鉆等,須在電力管理員指導(dǎo)下用電。
4.工作時發(fā)現(xiàn)用電安全隱患如漏電、火花、設(shè)備異常發(fā)燒等現(xiàn)象,應(yīng)立即報告機房電力管理員,并協(xié)助進行處理。
5、機房停電需要啟用內(nèi)部發(fā)電系統(tǒng)時,設(shè)備管理人須在場及時檢查自管設(shè)備是否正常供電。
6、機房電力管理員應(yīng)定期對機房供電設(shè)備、線路、電源、開關(guān)等相關(guān)設(shè)備進行安全檢查,及時排除用電安全隱患。
1.綜述 為盡量避免機房內(nèi)電力意外事故,以保障人身安全、防止設(shè)備損壞及影響供電系統(tǒng)等為目的。規(guī)范數(shù)據(jù)中心機房設(shè)備加電、日常操作的用電安全防護措施,制定本文檔。
2.范圍 本文檔適用于北京移動數(shù)據(jù)中心所有機房(菜市口、望京、昌平、豐臺、大白樓)。
3.用電安全措施 機房日常用電安全的最高準則為確保人員安全。3.1 設(shè)備用電安全措施 3.1.1設(shè)備上架加電要求
?? 所有進入機房,需使用機房電源的設(shè)備應(yīng)為正規(guī)品牌且具有3C標志(即中國強制性產(chǎn)品認證)中CCC+5安全認證標志或CCC+S&B安全與電磁兼容認證標志任意一個。任何自行組裝(DIY)設(shè)備不得上架加電。? 設(shè)備上架加電前應(yīng)在機房外,使用非機房(生產(chǎn)用電)電源進行加電、開機測試,測試該設(shè)備電源組件為正常運行方可上架加電。? 不能在機房外加電測試的直流電設(shè)備,進入機房后首次加電需機房負責(zé)人,電力維護人員,中通維護人員,運維人員及客戶同時在場。? 不能在機房加電測試的其他交流電設(shè)備,進入機房后首次加電需機房負責(zé)人中通維護人員,運維人員及客戶同時 在場。? 設(shè)備上架后,加電前,由中通維護人員對機柜電源進行通路、電壓測試,測試結(jié)果正常后由客戶自行閉合對應(yīng)的空開。●以上任意一點不能達到標準,必須由機房負責(zé)人書面(包含郵件)批準。
3.1.2 設(shè)備日常操作安全措施
? 機房內(nèi)應(yīng)設(shè)置維護和測試用電源插座(地插、強插等),供日常維護過程中接插相關(guān)維護設(shè)備,儀器儀表等。嚴禁隨意使用機柜內(nèi)電源接插。? 需要關(guān)閉電源時,不要設(shè)想電源已關(guān)閉,必須仔細檢查,確認。? 為避免靜電對設(shè)備的電子器件造成損壞,對設(shè)備進行操作時應(yīng)穿著防靜電服或戴防靜電手套或佩戴防靜電手鐲。? 拿電路板時,應(yīng)拿電路板邊緣,不要接觸元器件和印制電路。? 保持機柜內(nèi)清潔、無塵。? 防靜電手鐲的使用方法如下:
1、將手伸進防靜電手鐲,戴至手腕處。
2、拉緊鎖扣,確認防靜電手鐲與皮膚有良好的接觸。
3、將防靜電手鐲,插入設(shè)備的防靜電手鐲插孔內(nèi),或者是用鱷魚夾夾在機柜的接地處。
4、確認防靜電手鐲良好接地。3.2.日常維護人員安全措施:
? 非電工作業(yè)人員、不具有電氣電力專業(yè)資質(zhì)人員嚴禁進行任何電工作業(yè)。電工作業(yè)包括但不限于以下內(nèi)容:對機房配供電設(shè)施、裝置進行安裝、維護、檢查、檢修等操作。? 配供電設(shè)施、裝置的絕緣或外殼損壞,可能導(dǎo)致人體接觸及帶電部分時,應(yīng)立即停止使用,并及時修復(fù)或更換。? 移動用電設(shè)備、打開用電設(shè)備外殼時必須拔掉所有電源線和外部電纜。? 確認操作區(qū)域內(nèi)地面無積水、潮濕等。? 為避免出現(xiàn)意外,盡量不要一個人進行帶電維護。維護前應(yīng)確認設(shè)備的電源開關(guān),如發(fā)生意外,第一時間切斷對應(yīng)的電源開關(guān)。
1.機房工作人員應(yīng)學(xué)習(xí)常規(guī)的用電安全操作和知識,了解機房內(nèi)部的供電、用電設(shè)施的操作規(guī)程,注意節(jié)約用電。
2.機房工作人員應(yīng)經(jīng)常實習(xí)、掌握機房用電應(yīng)急處理步驟、措施和要領(lǐng);在真正接通設(shè)備電源之前必須先檢查線路、接頭是否安全連接以及設(shè)備是否已經(jīng)就緒、人員是否已經(jīng)具備安全保護。
3.機房管理人員必須定期安排有專業(yè)資質(zhì)的人員檢查供電、用電設(shè)備、設(shè)施;如發(fā)現(xiàn)用電安全隱患,應(yīng)即時采取措施解決,不能解決的必須及時向相關(guān)負責(zé)人員提出解決。
4.機房不得亂拉亂接電線,應(yīng)選用安全、有保證的供電、用電器材;嚴禁隨意對設(shè)備斷電、更改設(shè)備供電線路,嚴禁隨意串接、并接、搭接各種供電線路。
5.機房工作人員對個人用電安全負責(zé)。外來人員需要用電的,必須得到機房管理人員允許,并使用安全和對機房設(shè)備影響最少的供電方式。
6.機房工作人員需要離開當前用電工作環(huán)境時,應(yīng)檢查并保證工作環(huán)境的用電安全。
7.最后離開機房的工作人員,應(yīng)檢查所有用電設(shè)備,應(yīng)關(guān)閉長時間帶電運作可能會產(chǎn)生嚴重后果的用電設(shè)備。
8.禁止在無人看管下在機房中使用高溫、熾熱、產(chǎn)生火花的用電設(shè)備。
9.在使用功率超過額定瓦數(shù)的用電設(shè)備前,必須得到上級主管批準,并在保證線路安全的基礎(chǔ)上使用。
10.在外部供電系統(tǒng)停電時,機房工作人員應(yīng)全力配合完成停電應(yīng)急工作。
第二篇:機房應(yīng)急預(yù)案
應(yīng)急處置方案
第一節(jié) 總 則
1、保證人員和財產(chǎn)的安全為前提的原則:在由于火災(zāi)或電力問題造成的主機故障,在解決故障前,應(yīng)以保證人員的生命安全和財產(chǎn)的安全為前提,然后進行故障的解決。
2、最快時間恢復(fù)業(yè)務(wù)的原則:本著先想盡一切方法,盡快恢復(fù)業(yè)務(wù)的原則來處理故障,如在有備用設(shè)備的情況下,主設(shè)備產(chǎn)生了故障,應(yīng)先盡快將應(yīng)用切換到備用機上,使業(yè)務(wù)能夠運行,再對故障設(shè)備進行診斷和維修。
3、故障應(yīng)急人員高度負責(zé)的原則:當故障應(yīng)急人員在節(jié)假日接到故障通知時,本著高度負責(zé)的態(tài)度,應(yīng)迅速接手處理障礙,如遠程無法處理解決,應(yīng)迅速趕到故障設(shè)備所在地,進行現(xiàn)場處理,處理故障的同時應(yīng)及時向領(lǐng)導(dǎo)匯報。應(yīng)急人員不可互相推卸責(zé)任,如因特殊情況,確實無法處理障礙,部門領(lǐng)導(dǎo)必須安排好其他人員處理。
4、盡可能全面的保留故障現(xiàn)場的原則:當故障發(fā)生后,應(yīng)急人員應(yīng)盡可能全面的備份出能夠反映故障現(xiàn)象的各種日志、記錄、受損文件等,便于業(yè)務(wù)恢復(fù)后,對故障的分析、解決,杜絕故障的再次發(fā)生。
應(yīng)急方案的目標:保證預(yù)付卡運營系統(tǒng)連續(xù)安全穩(wěn)定地運行。
第二節(jié) 應(yīng)急領(lǐng)導(dǎo)小組
應(yīng)急領(lǐng)導(dǎo)小組成員:
組 長: 副組長: 成 員:
第三節(jié) 電源系統(tǒng)故障應(yīng)急處理
定期檢查信息中心機房電源設(shè)備的運行狀況,當發(fā)生下列突發(fā)事件時,按以下方案進行處置:
當中心機房發(fā)生市電供電突然停電或遠程報警電源異常時。首先確認是否為正常停電及預(yù)計停電時間。檢查不間斷電源的電池可供電時間,需在不間斷電源供電時效內(nèi)關(guān)閉所有服務(wù)器及網(wǎng)絡(luò)設(shè)備。
聯(lián)系工程部查看停電原因,盡快恢復(fù)供電,并將情況報告相關(guān)領(lǐng)導(dǎo)
工程部聯(lián)系電話:
第四節(jié) 空調(diào)系統(tǒng)故障應(yīng)急處理
定期對空調(diào)的運行情況進行檢查,如有報警信息,應(yīng)及時查找故障原因,對于不能自行排除的問題,應(yīng)及時與設(shè)備提供商進行聯(lián)系。
當中心機房主空調(diào)因故障無法制冷,致使機房內(nèi)環(huán)境溫度超過攝氏40度時,打開機房房門,并關(guān)閉所有服務(wù)器及網(wǎng)絡(luò)設(shè)備。對于無法自行處置的空調(diào)系統(tǒng)異常情況,及時與設(shè)備提供商聯(lián)系,并報告公司領(lǐng)導(dǎo)。空調(diào)問題聯(lián)系人:
第五節(jié) 中心機房自動消防系統(tǒng)應(yīng)急處理
當中心機房發(fā)生火警時,按以下方案進行處置:
1.上班工作時間發(fā)生火警,聽到自動消防系統(tǒng)發(fā)出的聲光報警后,中心機房附近辦公室人員應(yīng)及時緊急撤離,避免氣體自動消防系統(tǒng)啟動后,消防氣體對附近人員造成人身傷害。確認火警后,立刻撥打119報警,并說明盡量使用氣體滅火器進行滅火,減少電子設(shè)備的損壞。
2.發(fā)生火警后,信息中心相關(guān)人員應(yīng)馬上趕赴現(xiàn)場,并向有關(guān)領(lǐng)導(dǎo)報告事故情況。同時立即聯(lián)系聯(lián)通等相關(guān)公司,及時評估事故損失情況,研討盡快恢復(fù)信息系統(tǒng)正常運行的最佳方案。安保消防中控電話:
第六節(jié) 設(shè)備、網(wǎng)絡(luò)系統(tǒng)故障應(yīng)急處理
設(shè)備、網(wǎng)絡(luò)應(yīng)用系統(tǒng)故障應(yīng)由發(fā)現(xiàn)人通知技術(shù)部,技術(shù)部門立即檢查故障,進行初步故障定位,解決;
1.網(wǎng)絡(luò)設(shè)備、服務(wù)器、儲存設(shè)備均有備份,當設(shè)備存在硬件問題時,可隨時把業(yè)務(wù)切換到備份主機上,保證業(yè)務(wù)正常運行; 2.應(yīng)用系統(tǒng)每更新一次則做一次遠程備份,在遠程主機上分別備份舊的應(yīng)用系統(tǒng)和更新后的應(yīng)用系統(tǒng),以當天的更新日期命名; 3.對磁盤柜上的數(shù)據(jù)庫文件有定時任務(wù),每天凌晨4:00會把數(shù)據(jù)庫里的數(shù)據(jù)文件倒出到遠程備份主機上,以確保磁盤柜出現(xiàn)硬件故障的時候,數(shù)據(jù)文件不丟失;對于網(wǎng)絡(luò)、應(yīng)用系統(tǒng)出現(xiàn)硬件方面的故障,比較嚴重的問題,對業(yè)務(wù)的正常運行造成較大的影響,立即向有關(guān)領(lǐng)導(dǎo)報告。
4、網(wǎng)絡(luò)中有監(jiān)控服務(wù)器,運用Cacti v10最新的版本,監(jiān)控網(wǎng)絡(luò)所有設(shè)備(路由器,防火墻,交換機以及服務(wù)器設(shè)備);對設(shè)備本身的硬件檢測、外部入侵檢測、外部攻擊等多種對系統(tǒng)不利因素以發(fā)送mail的形式報警;相關(guān)人員收到報警信息,分析收到的log日志以做出相應(yīng)的處理。
5、每周周五對網(wǎng)絡(luò)設(shè)備進行日志及配置文件采集,對數(shù)據(jù)庫數(shù)據(jù)文件定期下載,和遠程備份;在本地電腦上保存最近的配置文件,以便在發(fā)生毀滅性的災(zāi)難時,用來重組。
對簡單故障,運維人員應(yīng)迅速排除故障,解決問題并記錄。如果需要更換設(shè)備,應(yīng)上報有關(guān)領(lǐng)導(dǎo),經(jīng)批準后馬上更換故障設(shè)備,盡快恢復(fù)網(wǎng)絡(luò)、應(yīng)用系統(tǒng)運行。運維部門判斷無法及時修理時,應(yīng)立即通知相關(guān)的系統(tǒng)運行服務(wù)提供商,在最短的時間內(nèi)安排修理或更換系統(tǒng)。
如發(fā)現(xiàn)屬外部線路的問題,應(yīng)與線路服務(wù)提供商聯(lián)系,敦促對方盡快恢復(fù)故障線路。
啟用備份線路、設(shè)備、系統(tǒng),迅速恢復(fù)相關(guān)的應(yīng)用。
聯(lián)通聯(lián)系電話:
第七節(jié) 黑客入侵的應(yīng)急處理
發(fā)現(xiàn)網(wǎng)絡(luò)上有黑客攻擊行為,任何人員都有義務(wù)向技術(shù)部門報告。技術(shù)部立即啟動應(yīng)急響應(yīng),切斷受攻擊計算機與網(wǎng)絡(luò)的連接,停止一切操作、保護現(xiàn)場,并上報有關(guān)領(lǐng)導(dǎo)。
對于黑客攻擊,由計算中心組織應(yīng)急響應(yīng)專家小組查找入侵蹤跡,分析入侵方式和原因。由安全管理員根據(jù)對入侵事件的分析,組織相關(guān)人員對內(nèi)部網(wǎng)計算機整改,防止黑客用同樣的手段再次入侵其他系統(tǒng)。安全管理員檢查確定無安全隱患后,才可將受攻擊計算機重新連接網(wǎng)絡(luò),或啟用備份計算機來恢復(fù)應(yīng)用。
安全管理員應(yīng)做好記錄,保護現(xiàn)場,進行日志收集等工作。如果能追查到攻擊者的相關(guān)信息,可以對其發(fā)出警告,必要時可以采取進一步的行動,乃至采取法律手段。根據(jù)破壞程度,經(jīng)有關(guān)領(lǐng)導(dǎo)同意后,上報公安部門。
若系統(tǒng)已被黑客破壞,無法恢復(fù),應(yīng)將受黑客攻擊的計算機上的重要數(shù)據(jù)備份到其他存儲介質(zhì),確保計算機內(nèi)重要的數(shù)據(jù)不丟失。如果數(shù)據(jù)無法恢復(fù),經(jīng)有關(guān)領(lǐng)導(dǎo)同意后,可與國家指定的部門聯(lián)系,由他們來協(xié)助恢復(fù),為保證數(shù)據(jù)信息安全,需在安全管理部門作記錄。
第八節(jié) 生產(chǎn)系統(tǒng)、數(shù)據(jù)庫故障處理
生產(chǎn)系統(tǒng)出現(xiàn)故障,技術(shù)部做出應(yīng)急處理
1.因軟件設(shè)計缺陷、設(shè)計漏洞等引起的故障,通知公司研發(fā)部門在2小時內(nèi)查明原因,解決問題。
2.數(shù)據(jù)庫出現(xiàn)故障,運維人員應(yīng)在2小時內(nèi)查清故障原因,其他相關(guān)部門應(yīng)積極配合,解決問題。
3.如出現(xiàn)數(shù)據(jù)丟失情況,確認不能自行恢復(fù)后,啟用備份恢復(fù)數(shù)據(jù),24小時內(nèi)恢復(fù)運營。
本方案自發(fā)布之日起施行
第三篇:機房應(yīng)急預(yù)案
中心機房突發(fā)事件應(yīng)急預(yù)案
第一條
機房突發(fā)事件包括網(wǎng)絡(luò)設(shè)備或服務(wù)器故障、自然災(zāi)害(水、火、電等)造成的 物理破壞、人為失誤造成的安全事件等等。針對突發(fā)事件的預(yù)防措施如下:
1.建立安全、可靠、穩(wěn)定運行的機房環(huán)境,防火、防盜、防雷電、防水、防靜電、防塵; 建立備份電源系統(tǒng);加強所有人員防火、防盜等基本技能培訓(xùn)。
2.服務(wù)器采用可靠、穩(wěn)定的硬件設(shè)備,落實數(shù)據(jù)備份機制,安裝有效的防病毒軟件,及時 更新升級掃描引擎;加強對局域網(wǎng)內(nèi)所有用戶和信息系統(tǒng)管理員的安全技術(shù)培訓(xùn)。
第二條
機房漏水應(yīng)急預(yù)案如下:
1.發(fā)生機房漏水時,第一目擊者應(yīng)立即通知機房管理人員。
2.若空調(diào)系統(tǒng)出現(xiàn)滲漏水,機房管理人員應(yīng)立即安排停用故障空調(diào),清除機房積水,并及 時聯(lián)系設(shè)備供應(yīng)方處理,同時啟動備用空調(diào),必要情況下可臨時用電扇對服務(wù)器進行降溫。3.若為墻體或窗戶滲漏水,機房管理人員應(yīng)立即采取有效措施確保機房安全,同時安排通 知辦公室,及時清除積水,維修墻體或窗戶,消除滲漏水隱患。
第三條
機房火災(zāi)應(yīng)急預(yù)案如下:
1.完善機房環(huán)境,確保機房具備二氧化碳滅火器;禁止攜帶易燃易爆物品進入機房。2.機房管理人員應(yīng)熟悉機房內(nèi)部消防安全操作和規(guī)則,了解消防設(shè)備操作原理,掌握消防 應(yīng)急處理步驟、措施和要領(lǐng),懂得滅火的方法,會撲救初起火災(zāi),并定期組織滅火演習(xí)。3.一旦發(fā)生火災(zāi),迅速切斷機房電源,避免災(zāi)情的擴散,并迅速撥打物業(yè)管理和119火警電話。
4.等待消防車到來期間,應(yīng)組織物業(yè)保安或工作人員在保證安全的前提下滅火,應(yīng)急領(lǐng)導(dǎo)小組應(yīng)在第一時間內(nèi)集中所有二氧化碳滅火器,抓住時機,盡可能的把火撲滅。
5.配合消防部門調(diào)查事故原因,對造成的損失和起火原因做好記錄,以便進行災(zāi)后總結(jié)。
第四條
雷擊事故應(yīng)急預(yù)案如下:
1.遇雷暴天氣,機房管理人員在下班后應(yīng)及時關(guān)閉所有服務(wù)器,切斷電源,暫停內(nèi)部計算 機網(wǎng)絡(luò)工作。
2.雷暴天氣結(jié)束后,機房管理人員應(yīng)及時開通服務(wù)器,恢復(fù)內(nèi)部計算機網(wǎng)絡(luò)工作,對設(shè)備 和數(shù)據(jù)進行檢查。出現(xiàn)故障的,事發(fā)部門應(yīng)將故障情況及時報告機房管理人員。
3.因雷擊造成損失的,機房管理人員應(yīng)會同相關(guān)部門進行核實、報損,并在調(diào)查工作結(jié)束 后一日內(nèi)書面報告領(lǐng)導(dǎo)。
第五條
設(shè)備防盜被盜或人為損害應(yīng)急預(yù)案如下:
1.機房管理人員每日查看、清點設(shè)備并鎖好機房大門。
2.機房管理人員每日檢查錄像監(jiān)控服務(wù)器狀態(tài),確保監(jiān)控畫面正常,并檢查每日錄像正常性、完整性。
3.發(fā)生設(shè)備被盜或人為損害設(shè)備情況時,使用者或管理者應(yīng)立即報告相關(guān)負責(zé)人,同時保護好現(xiàn)場。
4.機房維護人員接報后,通知保安及公安部門,一同核實審定現(xiàn)場情況,清點被盜物資或盤查人為損害情況,做好必要的影像記錄和文字記錄。
5.事發(fā)單位和當事人應(yīng)積極配合公安部門進行調(diào)查,并將有關(guān)情況向機房管理人員匯報。
第六條
機房停電應(yīng)急預(yù)案如下:
1.接到停電通知后,機房管理人員應(yīng)及時通過辦公系統(tǒng)、電話等發(fā)布相關(guān)信息,部署應(yīng)對具體措施,要求用戶在停電前停止業(yè)務(wù)、保存數(shù)據(jù)。
2.機房管理人員每日檢查UPS電源的狀態(tài),確保在突發(fā)停電時,UPS電源能自動供應(yīng)服務(wù)器正常工作半個小時,保證員工工作的數(shù)據(jù)及時保存。
第七條
通信網(wǎng)絡(luò)故障應(yīng)急預(yù)案如下:
1.發(fā)生通信線路中斷、流量異常等故障后,員工應(yīng)及時通知機房管理人員。
2.機房管理人員在接到報告后,迅速組織相關(guān)技術(shù)人員檢測故障區(qū)域,并作相關(guān)故障處理,必要時通知通信網(wǎng)絡(luò)運營商查清原因;逐步恢復(fù)故障區(qū)與服務(wù)器的網(wǎng)絡(luò)聯(lián)接,恢復(fù)通信網(wǎng)絡(luò),保證正常運轉(zhuǎn)。
3.應(yīng)急處理結(jié)束后,機房管理人員應(yīng)在一日之內(nèi)提交故障分析報告,以便備案。
第八條
服務(wù)器故障應(yīng)急預(yù)案如下:
1.機房管理人員每日檢查服務(wù)器狀態(tài),檢查郵箱服務(wù)器狀態(tài),確保系統(tǒng)運行的完善。
2.機房管理人員定期備份服務(wù)器數(shù)據(jù),并將備份資料刻錄成光盤或拷貝到移動硬盤。
第九條
1.發(fā)生機房突發(fā)事件后,機房管理人員應(yīng)采取有效措施開展先期處置,恢復(fù)信息網(wǎng)絡(luò)正常狀態(tài)。應(yīng)急處置工作結(jié)束后,機房管理人員對事件發(fā)生原因、性質(zhì)、影響、后果、責(zé)任及應(yīng)急處置能力、恢復(fù)重建等問題進行全面調(diào)查評估,根據(jù)應(yīng)急處置中暴露出的管理、協(xié)調(diào)和技術(shù)問題,改進和完善預(yù)案,實施針對性演練,總結(jié)經(jīng)驗教訓(xùn),整改存在隱患,組織恢復(fù)正常工作秩序。
第四篇:機房火災(zāi)事故應(yīng)急預(yù)案
機房火災(zāi)事故應(yīng)急預(yù)案
1.總則 1.1編制目的
為高效有序地做好機房火災(zāi)事故的應(yīng)急處置工作,避免或最大程度地減輕火災(zāi)事故造成的損失,保障員工生命和企業(yè)財產(chǎn)安全,維護社會穩(wěn)定。1.2編制依據(jù)
《中華人民共和國安全生產(chǎn)法》 《江蘇省消防條例》 1.3適用范圍
適用于機房火災(zāi)事故的現(xiàn)場應(yīng)急處置和應(yīng)急救援工作。2.事件特征
2.1事件類型及危險性分析
2.1.1電氣線路短路、過載、接觸電阻過大,靜電,雷擊等強電侵入,機房內(nèi)電腦、空調(diào)等用電設(shè)備長時間通電過熱、設(shè)備故障等原因均可能引起計算機房的火災(zāi)事故。
2.1.2機房火災(zāi)事故會造成計算機設(shè)備損壞、系統(tǒng)故障網(wǎng)絡(luò)中斷或癱瘓,影響網(wǎng)絡(luò)的安全運行。
2.1.3火災(zāi)產(chǎn)生的有毒煙霧污染機房的空氣,造成人員中毒、窒息等人身傷亡事故。3.應(yīng)急組織及職責(zé) 3.1火災(zāi)應(yīng)急指揮部
應(yīng)急指揮部總指揮: 機房火災(zāi)應(yīng)急搶險指揮: 成員:
3.2指揮部人員的職責(zé)
3.2.1指揮的職責(zé):全面指揮突發(fā)事件應(yīng)急救援工作。
3.2.2高低壓專業(yè)職責(zé):組織、協(xié)調(diào)本部門人員參加應(yīng)急處置和救援工作,對發(fā)生險情機房切斷電源。
3.2.3智能化專業(yè)職責(zé):監(jiān)控相關(guān)區(qū)域事故情況。
3.2.4空調(diào)專業(yè)職責(zé):發(fā)現(xiàn)異常情況,及時切斷空調(diào)、通風(fēng)系統(tǒng),做好運行方式的調(diào)整和故障設(shè)備的隔離。4應(yīng)急處置
4.1現(xiàn)場應(yīng)急處置程序
4.1.1最早發(fā)現(xiàn)火情者應(yīng)立即向值班長和機房負責(zé)人匯報,機房負責(zé)人到現(xiàn)場指揮滅火,同時報告公司領(lǐng)導(dǎo),啟動本預(yù)案。
4.1.2機房負責(zé)人根據(jù)事故狀態(tài)及危害程度做出相應(yīng)的應(yīng)急決定,指揮疏散現(xiàn)場無關(guān)人員,各應(yīng)急救援隊立即開展救援。
4.1.3事故擴大時,撥打119報警電話請求市消防隊支援。報警內(nèi)容:單位名稱、地址、著火物質(zhì)、火勢大小、著火范圍。把自己的電話號碼和姓名告訴對方,以便聯(lián)系。同時還要注意聽清對方提出的問題,以便正確回答。打完電話后,要立即到交叉路口等候消防車的到來,以便引導(dǎo)消防車迅速趕到火災(zāi)現(xiàn)場。4.2現(xiàn)場應(yīng)急處置措施
4.2.1機房負責(zé)人組織人員迅速查明著火原因。4.2.2發(fā)生火災(zāi)事故后,運行值班人員在人身安全不受危害的情況下要堅守本職崗位,確保設(shè)備運行。
4.2.3火災(zāi)初起階段,值班人員要利用區(qū)域內(nèi)常規(guī)滅火器(干粉或氣體滅火器)進行撲救。控制初起火災(zāi),防止火勢蔓延。根據(jù)火勢情況立即啟動氣體自動滅火裝置。
4.2.4被困火場逃生時,應(yīng)用濕毛巾捂住口鼻,背向煙火方向迅速離開。逃生通道被切斷、短時間內(nèi)無人救援時,應(yīng)關(guān)緊迎火門窗,用濕毛巾、濕布堵塞門縫,用水淋透房門,防止煙火侵入。
4.2.5火災(zāi)發(fā)生時要采取有效措施撲滅身上的火焰,使傷員迅速脫離開致傷現(xiàn)場。當衣服著火時,應(yīng)采用各種方法盡快地滅火,如水浸、水淋、就地臥倒翻滾等,千萬不可直立奔跑或站立呼喊,以免助長燃燒,引起或加重呼吸道燒傷。滅火后傷員應(yīng)立即將衣服脫去,如衣服和皮膚粘在一起,可在救護人員的幫助下把未粘的部分剪去,并對創(chuàng)面進行包扎。
4.2.6在火場,對于燒傷創(chuàng)面一般可不做特殊處理,盡量不要弄破水泡,不能涂龍膽紫一類有色的外用藥,以免影響燒傷面深度的判斷。為防止創(chuàng)面繼續(xù)污染,避免加重感染和加深創(chuàng)面,對創(chuàng)面應(yīng)立即用三角巾、大紗布塊、清潔的衣眼和被單等,給予簡單而確實的包扎。手足被燒傷時,應(yīng)將各個指、趾分開包扎,以防粘連。
4.2.7消防隊到達火場時,應(yīng)立即與消防隊負責(zé)人取得聯(lián)系并交待失火設(shè)備現(xiàn)狀和運行設(shè)備狀況,然后協(xié)助消防隊滅火,并提供技術(shù)支援。4.2.8復(fù)情況,事故應(yīng)急處理全部結(jié)束,才能恢復(fù)生產(chǎn)秩序。4.3火災(zāi)事故報告流程
4.3.1出現(xiàn)火情后,值班人員除采取有效措施撲滅初期火情外應(yīng)立即想機房負責(zé)人匯報;
4.3.2火勢無法控制時由機房負責(zé)人決定報火警請求轄區(qū)消防隊救援。并在在火災(zāi)事故發(fā)生后1小時內(nèi)向所云匯報突發(fā)事件信息。速報內(nèi)容主要包括事故發(fā)生的時間、地點、人員傷亡、設(shè)備損壞情況、可能的引發(fā)因素和發(fā)展趨勢等。4.3.3聯(lián)系方式
消防隊: 119 醫(yī)務(wù)急救:120 4.4注意事項
4.4.1應(yīng)急處置時注意防止中毒、窒息、觸電、燙傷。
4.4.2危險區(qū)設(shè)好警戒線,并掛好標示牌。無操作權(quán)限的人員不得亂動現(xiàn)場設(shè)備。
4.4.3佩戴個人防護器具時注意檢查防護用品合格,且在有效檢驗期內(nèi);正確佩戴使用正壓式呼吸器、隔熱服、隔熱手套、絕緣靴等安全防護用具。
4.4.4現(xiàn)場自救和互救時不熟悉現(xiàn)場情況和滅火方法的人員不得盲目進入危險區(qū)域,救人前先確認自己的能力和現(xiàn)場情況是否能夠滿足對他人施救的需要。
4.4.5應(yīng)急救援結(jié)束后要全面檢查,確認現(xiàn)場無火災(zāi)隱患和建筑物坍塌的隱患。4.4.6加強自身防護,避免救火導(dǎo)致人身傷害。4.5附則
4.5.1機房應(yīng)急人員的聯(lián)系方式。
第五篇:中心機房應(yīng)急預(yù)案
中心機房應(yīng)急預(yù)案
一、系統(tǒng)故障應(yīng)急流程
1.1 系統(tǒng)故障應(yīng)急流程說明
一、故障發(fā)生
值班人員可從以下途徑得知故障的發(fā)生: 1)值班人員通過報警系統(tǒng)告警發(fā)現(xiàn)故障 2)值班人員通過遠程數(shù)據(jù)監(jiān)測發(fā)現(xiàn)故障 3)值班人員通過維護巡檢發(fā)現(xiàn)故障 4)系統(tǒng)用戶發(fā)現(xiàn)故障,報給呼叫值班人員
二、報障受理
值班人員發(fā)現(xiàn)系統(tǒng)故障發(fā)生后,立即響應(yīng),根據(jù)級別進行應(yīng)急處理,并向相關(guān)領(lǐng)導(dǎo)報告系統(tǒng)故障情況。
三、信息研判
值班人員根據(jù)了解到的系統(tǒng)故障情況進行分析判斷,以確定采用一般故障處理流程還是立即啟動系統(tǒng)突發(fā)故障應(yīng)急處理預(yù)案。
四、預(yù)案啟動
如需啟動應(yīng)急預(yù)案,則立刻通知相關(guān)領(lǐng)導(dǎo)小組,由相關(guān)領(lǐng)導(dǎo)小組啟動應(yīng)急預(yù)案,對系統(tǒng)突發(fā)故障應(yīng)急事件進行全面管控處理。
五、資源確認
系統(tǒng)突發(fā)故障應(yīng)急預(yù)案啟動后,首先是根據(jù)現(xiàn)場突發(fā)故障實際狀況、緊急程度、技術(shù)難度、備品備件等情況對相關(guān)資源(主要是參與人員)依據(jù)經(jīng)驗進行調(diào)度和確認,主要有以下資源:
本單位相關(guān)技術(shù)支持人員 授權(quán)第三方公司技術(shù)支持人員; 故障設(shè)備相關(guān)廠家技術(shù)支持人員; 聘請的技術(shù)專家
六、預(yù)案執(zhí)行
按照既定的預(yù)案進行突發(fā)事件處理和故障搶修,如遇到問題及時向相關(guān)領(lǐng)導(dǎo)小組匯報。
七、預(yù)案終止
預(yù)案的終止時間由故障現(xiàn)場技術(shù)人員根據(jù)現(xiàn)場的實際進展情況,在與用戶單位有關(guān)部門協(xié)調(diào)后相關(guān)領(lǐng)導(dǎo)小組決定。
八、結(jié)果上報
預(yù)案中止后,相關(guān)預(yù)案參與人員將整個事件過程中所有收發(fā)信息、領(lǐng)導(dǎo)批示、事故調(diào)查報告、現(xiàn)場錄像、圖片等材料及時整理歸檔,并總結(jié)事件處理過程中的經(jīng)驗和教訓(xùn),修改、完善事件應(yīng)急預(yù)案。然后集中上報至相關(guān)領(lǐng)導(dǎo)小組。
1.2 系統(tǒng)故障應(yīng)急處理流程圖
機房應(yīng)急預(yù)案
3.1 機房漏水應(yīng)急預(yù)案
(1)發(fā)生機房漏水時,第一目擊者應(yīng)立即檢測漏水影響范圍,并及時報告相關(guān)領(lǐng)導(dǎo)小組。
(2)若空調(diào)系統(tǒng)出現(xiàn)滲漏水,值班人員應(yīng)立即安排停用故障空調(diào),清除機房積水,并及時聯(lián)系設(shè)備供應(yīng)方處理,同時啟動備用空調(diào),必要情況下可其它方式(通風(fēng)、冰塊降溫等)對服務(wù)器進行降溫。
(3)若為墻體或窗戶滲漏水,值班人員應(yīng)立即采取有效措施確保機房安全,同時安排通知房屋產(chǎn)權(quán)方,及時清除積水,維修墻體或窗戶,消除 滲漏水隱患。
3.2 設(shè)備發(fā)生被盜或人為損害事件應(yīng)急預(yù)案
(1)發(fā)生設(shè)備被盜或人為損害設(shè)備情況時,使用者或管理者應(yīng)立即報告相關(guān)領(lǐng)導(dǎo)小組,同時保護好現(xiàn)場。
(2)相關(guān)領(lǐng)導(dǎo)小組接報后,通知用戶保衛(wèi)部門、相關(guān)領(lǐng)導(dǎo),一同核實審定現(xiàn)場情況,清點被盜物資或盤查人為損害情況,做好必要的影像記錄和文字記錄。
(3)值班人員應(yīng)當積極配合公安部門進行調(diào)查,并將有關(guān)情況向相關(guān)領(lǐng)導(dǎo)小組匯報。(4)相關(guān)領(lǐng)導(dǎo)小組安排相關(guān)技術(shù)人員及時恢復(fù)系統(tǒng)正常運行,并對事件進行調(diào)查。值班人員應(yīng)在調(diào)查結(jié)束后三日內(nèi)書面報告相關(guān)領(lǐng)導(dǎo)小組。
3.3 機房長時間停電應(yīng)急預(yù)案
(1)接到長時間停電通知后,值班人員應(yīng)及時通過辦公系統(tǒng)、電話等發(fā)布相關(guān)信息,部署應(yīng)對具體措施,要求相關(guān)保障人員在停電前及時就位,檢查業(yè)務(wù)系統(tǒng)、保存數(shù)據(jù)。
(2)停電時間過長的,應(yīng)準備充足燃油,并準備租用電力公司發(fā)電車協(xié)助,保證系統(tǒng)正常運轉(zhuǎn)。3.4 通信網(wǎng)絡(luò)故障應(yīng)急預(yù)案
(1)發(fā)生通信線路中斷、路由故障、流量異常、業(yè)務(wù)系統(tǒng)故障后,操作員應(yīng)及時通知本單位相關(guān)系統(tǒng)管理員,經(jīng)初步判斷后及時上報值班人員和相關(guān)領(lǐng)導(dǎo)小組。
(2)值班人員接報告后,應(yīng)及時查清通信網(wǎng)絡(luò)故障位置,隔離故障區(qū)域,并將事態(tài)及時報告相關(guān)領(lǐng)導(dǎo)小組,通知相關(guān)通信網(wǎng)絡(luò)運營商查清原因;同時及時組織相關(guān)技術(shù)人員檢測故障區(qū)域,逐步恢復(fù)故障區(qū)與服務(wù)器的網(wǎng)絡(luò)聯(lián)接,恢復(fù)通信網(wǎng)絡(luò),保證正常運轉(zhuǎn)。
(3)事態(tài)或后果嚴重的,應(yīng)及時向相關(guān)領(lǐng)導(dǎo)匯報。
(4)應(yīng)急處置結(jié)束后,值班人員應(yīng)將故障分析報告,在調(diào)查結(jié)束后三日內(nèi)書面報告相關(guān)領(lǐng)導(dǎo)小組。
3.5 不良信息和網(wǎng)絡(luò)病毒事件應(yīng)急預(yù)案
(1)發(fā)現(xiàn)不良信息或網(wǎng)絡(luò)病毒時,信息系統(tǒng)管理員應(yīng)立即斷開網(wǎng)線,終止不良信息或網(wǎng)絡(luò)病毒傳播,并報告相關(guān)系統(tǒng)維護人員和相關(guān)領(lǐng)導(dǎo)小組。
(2)值班人員應(yīng)根據(jù)相關(guān)領(lǐng)導(dǎo)小組指令,采取隔離網(wǎng)絡(luò)等措施,及時殺毒或清除不良信息,并追查不良信息來源。
(3)事態(tài)或后果嚴重的,應(yīng)向總公司相關(guān)領(lǐng)導(dǎo)匯報。
(4)處置結(jié)束后 ,值班人員應(yīng)將事發(fā)經(jīng)過、造成影響、處置結(jié)果在調(diào)查工作結(jié)束后三日內(nèi)書面報告相關(guān)領(lǐng)導(dǎo)小組。
3.6 服務(wù)器軟件系統(tǒng)故障應(yīng)急預(yù)案
(1)發(fā)生服務(wù)器軟件系統(tǒng)故障后,值班人員應(yīng)立即組織啟動備份服務(wù)器系統(tǒng),由備份服務(wù)器接管業(yè)務(wù)應(yīng)用,并及時報告相關(guān)領(lǐng)導(dǎo)小組;同時安排相關(guān)責(zé)任人將故障服務(wù)器脫離網(wǎng)絡(luò),保存系統(tǒng)狀態(tài)不變,取出系統(tǒng)鏡像備份磁盤,保持原始數(shù)據(jù)。
(2)值班人員應(yīng)根據(jù)相關(guān)領(lǐng)導(dǎo)小組的指令,在確認安全的情況下,重新啟動故障服務(wù)器系統(tǒng);重啟系統(tǒng)成功,則檢查數(shù)據(jù)丟失情況,利用備份數(shù)據(jù)恢復(fù);若重啟失敗,立即聯(lián)系相關(guān)廠商和上級單位,請求技術(shù)支援,作好技術(shù)處理。(3)事態(tài)或后果嚴重的,總公司相關(guān)領(lǐng)導(dǎo)匯報。
(4)處置結(jié)束后,值班人員應(yīng)將事發(fā)經(jīng)過、處置結(jié)果等在調(diào)查工作結(jié)束后三日內(nèi)報告相關(guān)領(lǐng)導(dǎo)小組。
3.7 黑客攻擊事件應(yīng)急預(yù)案
(1)當發(fā)現(xiàn)網(wǎng)絡(luò)被非法入侵、業(yè)務(wù)內(nèi)容被篡改,應(yīng)用服務(wù)器上的數(shù)據(jù)被非法拷貝、修改、刪除,或通過入侵檢測系統(tǒng)發(fā)現(xiàn)有黑客正在進行攻擊時,使用者或管理者應(yīng)斷開網(wǎng)絡(luò),并立即報告相關(guān)領(lǐng)導(dǎo)小組。
(2)接報告后,相關(guān)領(lǐng)導(dǎo)小組應(yīng)立即指令相關(guān)技術(shù)人員核實情況,關(guān)閉服務(wù)器或系統(tǒng),修改防火墻和路由器的過濾規(guī)則,封鎖或刪除被攻破的登陸帳號,阻斷可疑用戶進入網(wǎng)絡(luò)的通道。
(3)值班人員應(yīng)及時清理系統(tǒng),恢復(fù)數(shù)據(jù)、程序,恢復(fù)系統(tǒng)和網(wǎng)絡(luò)正常;情況嚴重的,應(yīng)向總公司相關(guān)領(lǐng)導(dǎo)匯報,并請求支援。
(4)處置結(jié)束后 ,值班人員應(yīng)將事發(fā)經(jīng)過、處置結(jié)果等在調(diào)查工作結(jié)束后三日內(nèi)報告相關(guān)領(lǐng)導(dǎo)小組。
3.8 核心設(shè)備硬件故障應(yīng)急預(yù)案
(1)發(fā)生核心設(shè)備硬件故障后,值班人員應(yīng)及時報告相關(guān)領(lǐng)導(dǎo)小組,并組織查找、確定故障設(shè)備及故障原因,進行先期處置。
(2)若故障設(shè)備在短時間內(nèi)無法修復(fù)值班人員應(yīng)啟動備份設(shè)備,保持系統(tǒng)正常運行;將故障設(shè)備脫離網(wǎng)絡(luò),進行故障排除工作。
(3)值班人員故障排除后,在網(wǎng)絡(luò)空閑時期,替換備用設(shè)備;若故障仍然存在,立即聯(lián)系相關(guān)廠商,認真填寫設(shè)備故障報告單備查。
(4)事態(tài)或后果嚴重的,應(yīng)向總公司相關(guān)領(lǐng)導(dǎo)匯報。
3.9 業(yè)務(wù)數(shù)據(jù)損壞應(yīng)急預(yù)案
(1)發(fā)生業(yè)務(wù)數(shù)據(jù)損壞時,值班人員應(yīng)及時報告相關(guān)領(lǐng)導(dǎo)小組,檢查、備份業(yè)務(wù)系統(tǒng)當前數(shù)據(jù)。(2)值班人員負責(zé)調(diào)用備份服務(wù)器備份數(shù)據(jù),若備份數(shù)據(jù)損壞,則調(diào)用磁帶機中歷史備份數(shù)據(jù),若磁帶機數(shù)據(jù)仍不可用,則調(diào)用異地備份數(shù)據(jù)。
(3)業(yè)務(wù)數(shù)據(jù)損壞事件超過 X小時后,維護小組應(yīng)及時報告相關(guān)領(lǐng)導(dǎo),及時通知業(yè)務(wù)部門以其它方式開展業(yè)務(wù)。
(4)值班人員應(yīng)待業(yè)務(wù)數(shù)據(jù)系統(tǒng)恢復(fù)后,檢查歷史數(shù)據(jù)和當前數(shù)據(jù)的差別,由相關(guān)系統(tǒng)業(yè)務(wù)員補錄數(shù)據(jù);重新備份數(shù)據(jù),并寫出故障分析報告,在調(diào)查工作結(jié)束后三日內(nèi)報告相關(guān)領(lǐng)導(dǎo)。
3.10 雷擊事故應(yīng)急預(yù)案
(1)遇雷暴天氣或接上級部門雷暴氣象預(yù)警,值班人員應(yīng)及時報告相關(guān)領(lǐng)導(dǎo),經(jīng)請示同意后關(guān)閉部分服務(wù)器,切斷電源,暫停內(nèi)部計算機部分網(wǎng)絡(luò)工作。
(2)雷暴天氣結(jié)束后,值班人員報經(jīng)相關(guān)領(lǐng)導(dǎo)小組同意,及時開通服務(wù)器,恢復(fù)停用的計算機網(wǎng)絡(luò)工作,對設(shè)備和數(shù)據(jù)進行檢查。
(3)因雷擊造成損失的,值班人員應(yīng)會同相關(guān)部門進行核實、報損,并在調(diào)查工作結(jié)束后三日內(nèi)書面報告相關(guān)領(lǐng)導(dǎo)小組。必要時,應(yīng)向總公司相關(guān)領(lǐng)導(dǎo)匯報。
四、機房動力系統(tǒng)應(yīng)急處理方案
在機房動力發(fā)生異常情況時,動力系統(tǒng)通常可自動切換由備用電池提供機房設(shè)備的動力,在發(fā)生重大事故或自然災(zāi)害而無法短時間內(nèi)正常恢復(fù)機房動力的情況下,啟動機房動力系統(tǒng)應(yīng)急處理流程,采用應(yīng)急油機發(fā)電,確保用戶單位網(wǎng)點通信網(wǎng)絡(luò)能夠安全、高效和可靠地運行。具體流程見下圖: 監(jiān)控到機房動力異常告警 通知維護站赴現(xiàn)場,監(jiān)視動力系統(tǒng)電壓下降情況 停電時間超過備用電池的合適支撐時間? 否 是 通知相關(guān)部門協(xié)助排查動力系統(tǒng)故障 超過蓄電池允許放電電壓,立即啟動油機發(fā)電 動力恢復(fù) 關(guān)閉油機供電開關(guān) 關(guān)閉電源柜油機開關(guān) 關(guān)閉/拆除油機 市電供電/蓄電池充電正常 消障
當發(fā)生長時間停電的動力系統(tǒng)故障時,搶修人員在機房現(xiàn)場實時測試記錄備用電池的放電情況,電池放電容量超過40%時,如果動力系統(tǒng)還沒有恢復(fù)正常供電,就用油機發(fā)電為機房提供動力。
動力系統(tǒng)恢復(fù)后立即對電池進行均充。一天內(nèi)發(fā)生多次停電,放電容量在50%以下,均充轉(zhuǎn)浮充后,浮充時間不少于24小時。一次停電放電容量在50%~80%時,均充轉(zhuǎn)浮充后,浮充時間不少于48小時。