第一篇:核心機房電力中斷不間斷電源系統應急預案
核心機房電力中斷不間斷電源系統應急預案
核心機房電力的保障一直是維護體系的頭等重要事項,通過實施應急發電演練,建立了可靠的應急預案機制,最大限度的降低電源中斷對網絡傳輸質量的影響。現分享核心機房電源中斷應急預案,希望分公司盡快建立一套統一指揮、職責明確、反應迅速、處置有力的機房安全保障機制。組織架構:
責任領導、工程維護、網絡監控、網絡運維、質量管理等相關人員。機房電源系統說明:
1.機房電力是兩路三相四線制供電,進線線纜規格為:RVV50*4+16*1銅芯護套線。2.機房電源系統采用三級防雷系統,三級防雷分別位于電源進線端、UPS輸入前端。3.機房現有兩臺60KVA-UPS電源,均處于正常運行狀態。4.機房現有設備機柜已編號,均通過UPS電源和市電供電,每個機柜有獨立的20A空氣開關。空調、墻壁插座開關、應急燈、照明等都是單獨空開接市電。5.運行中的UPS電源所帶負荷,在逆變運行狀態下能正常工作約4小時(已經過UPS放電測試)。
一.核心機房電源中斷預案 1.在接到停電通知的情況下:
1)計劃性停電通知要確保綜合部、工維機房管理部對口人接到通知(提前將對口聯系人備案在物業處),機房管理員接到計劃停電通知后,升級到調度中心進行信息發送,同步進行郵件通知相應應急小組成員。并與負責組長及責任領導電話告知,確保已經接收到本次停電的時間及可能發生的情況。
2)維部進行發電應急預案小組成員通知,提前做好機房發電預案要求的準備工作,將相應的發電機、連接線、人員安排到位,各司其職,隨時待命現場,做發電準備工作。確保停電時刻的電力安全及機房用電的保障措施,提前調度安排好相應人員做好保障用電的措施。3)計劃停電時間開始后,馬上啟動應急發電操作,按照機房發電操作步驟實施階梯供電的步驟,恢復市電保障。并進行現場值守及設備工作確認,確保全部正常后電話告知調度中心及維護體系領導。
2.在沒有接到任何通知,突然發生停電的情況下:
確認停電線路,停電時刻,停電時間等要素,啟動核心機房發電應急預案。1)值班網管工作流程:
⑴值班網管監控到核心機房停電,第一時間告知工維部、網絡部、運維部應急小組組長。信息傳達到工維部機房管理員(一主一備),告知停電開始時間。
要求在停電5分鐘內將消息傳達到調度中心,各應急小組組長。如無法聯系上,進行升級到責任領導-工維部經理經理處。⑵網管將停電信息電話傳達后,進行調度派單,確保全部的應急小組成員都收到本次故障停電的信息。然后進行機房中設備的檢查,包括:UPS設備主機、各核心設備、匯聚設備、服務器、語音系統等。檢查是否受影響。同時啟動機房降溫措施(降溫方案:初步為加裝抽排風設備、增加大風扇排風形成熱量流動降溫)
⑶實時監控設備及UPS工作情況,包括:電量下降情況,設備工作正常情況,每15分鐘通報一次電量情況。
2)運維部應急工作流程:
⑴運維應急同事接到故障通告后,第一時間往停電現場趕,到現場配合網管/工維部門進行設備儀器的檢查、客服語音系統的保障,應急發電的協助。⑵現場配合進行機房降溫散熱措施實施,實時檢查網絡設備的工作情況。3)運營質量管理應急工作流程:
⑴調度中心值班人員接到網管監控調度信息后,第一時間將故障信息記錄并發故障通告到相關應急成員,并電話通知各應急小組組長是否知悉。
⑵進行客服調度系統的設備工作運行系統檢查,特別語音系統級坐席電腦,是否有問題,如發現工作系統有異常,及時與運維應急小組成員溝通,進行檢查處理。⑶實時關注故障工單流程進度登記,配合應急小組進行人員調度通告。4)工維部應急工作流程:
⑴機房管理員第一時間往停電現場趕,同時進行電話溝通供電公司、物業方等,咨詢停電原因,是屬于計劃性還是突發性停電,預計停電時長,將咨詢清楚的結果反饋到應急小組成員中,電話聯系物業溝通好需要發電需求申請。
⑵工維應急小組組長接到時間后第一時間往停電現場趕,同時進行發電應急小組成員調度,安排第一時間到場工作開展,并升級通報告知主管領導,對口集團維護中心上報信息。⑶工維應急小組成員接到停電時間后第一時間往停電現場趕,要求30分鐘內必須到場(住機房附近的人員往現場去,較遠同事可以進行打車往現場去),先行到處同事配合網管、運維同事啟動做好應急發電前的準備:連接線布放、接續、發電機發電前檢測油/電/水路檢查,確保正常。確保一切就緒后,確認可以進行發電操作后,按照發電操作流程進行發電恢復市電。
⑷網管將監控到停電的相應信息及級別同步發送到運營質量管理部調度崗,由調度崗將相應信息進行工維、運維、網絡關聯同事進行信息告知,同時報工維主管領導知悉。5)應急機房發電操作流程:
⑴機房用電系統包括四方面:空調制冷、主/備UPS主機、照明系統、客服調度系統。⑵發電前考慮4方面系統設備用電功率情況,為保障發電機帶動的正常,不能進行同步供電,要區分優先恢復的步驟實施,確認發電機的工作正常。在發電前將需要供電的“空調制冷、主/備UPS主機、照明系統、客服調度系統”的市電輸入主開關關閉。防止同步啟動時發電機的無法供電保證。
⑶啟動發電機,檢測發電輸出電流通斷,待發電機運行穩定后。第一步啟動空調制冷系統的市電輸入開關,運維應急小組成員重新啟動空調主機(空調因為市電恢復后需要重新啟動)觀察空調制冷工作是否正常。
第二步啟動主UPS設備的市電輸入開關,觀察發電機運行穩定情況,主UPS主機工作穩定情況,網絡設備的工作正常與否。
第三步啟動客服系統的市電輸入開關,包括(客服坐席電腦、UPS設備、空調制冷等),觀察發電機運行穩定情況,設備恢復工作情況。
第四步啟動備UPS設備、市電照明的市電輸入開關,觀察發電機運行穩定情況,備UPS主機工作穩定情況,網絡設備的工作正常與否。
⑷發電機啟動,市電輸入正常后,網管將降溫系統的抽排風設備關閉,與運維同事進行所有設備的運行進行全面的檢查,確保設備已經是運行正常。
⑸發電機發起市電正常后,工維應急小組安排專人現場值守,及時關注發電機油量情況,同時與油品供應商確認油品配送要求及時間要求,并實時與供電部門確認市電恢復時間。6)停電過程中突發事項預防:
⑴網管在停電時進行機房確認運行中的UPS工作組、設備組工作狀態。主/備UPS工作切換是否正常,在市電中斷時UPS是否已經開始進行供電保護。⑵值班網管對機房中的所有設備進行全面檢查,確保所有的設備已經是有主備供電,市電中斷后UPS已經正常保障設備工作。同時對機房的溫度進行觀察,溫度是否突然升高。⑶停電后,UPS處于逆變工作狀態,當班人員要每隔15分鐘觀察一次UPS的蓄電池容量、帶負荷情況、機房環境溫度,盡量使蓄電池容量大于60%,帶負荷小于85%(因為已經有自購發電機應急,盡快要求短時間發起電,減少UPS的放電過度)。
⑷發現機房環境溫度大于26℃。當以上指標不能保證時,要及時向機房管理員匯報,同時上報責任領導知悉,網管預案小組成員經過慎重討論,適時采取關閉不必要網絡的網絡設備、加強通風降溫等措施盡量延長關鍵設備運行時間。二.核心機房應急發電流程圖及崗位責任
三.應急發電機的油品保障措施
發電機正常啟動后,需要做到油品及時供應,具體保障措施方案為: 1.確認多家供應商進行油品供應,簽署油品供應協議,確保油品的供應充足。2.油品的供應以應急小組成員通知后開始準備,協議要求是6小時內送貨到場。
3.只要進行發電一小時以上,則必須在停止發電后補充滿油品,確保發電機隨時都是滿配油品保障中。
4.油品的零購是屬于公安部門的監管,所以分公司提前將資料向公安部門報備,在公司因為特殊原因有零購油品需求,在公安部門已經有分公司備案資料下,每次使用零購油品進行公安部門蓋章申請。可以隨時進行購買。四.恢復交流電后的處理措施
1.打開電力室和網絡機房空調市電開關,并將調節溫度設定為20℃。首先恢復機房制冷系統的正常工作。
2.等供電穩定后(一般在恢復市電10分鐘后),閉合主/備UPS設備空氣開關,恢復給主/備UPS交流供電。觀察并確認UPS轉換為交流穩壓和浮充狀態。
3.閉合客服系統的主空氣開關,恢復客服系統的交流供電,并觀察設備工作運行情況。4.觀察10分鐘后,確保所有網絡及設備、UPS設備組工作穩定后,將發電機停止發電,并將情況報告給調度及主管領導。
5.應急小組將發電的物資進行收拾整理存放好,并進行記錄發電機的工作時間及油/水/電路的切斷。機房的降溫設備的關閉確認及物資收拾整理存放好。6.將處理情況做詳細書面記錄,請相關人員簽字確認并報集團公司信息化系統管理平臺上填寫相關記錄。
五.發電機的日常維護措施 對于柴油發電機來說,由于它不是日常的主要供電設備,所以日常的維護保養主要包括以下幾個方面:
1.定期檢查和更換柴油過濾器和機油過濾器;
2.定期清理檢查進氣過濾器,并在固定的周期進行更換(或者根據現場的工況和進氣過濾器的透氣程度進行更換);
3.定期檢查和清理電池組接線柱,保持接線柱清潔; 4.定期檢查電池組的充電狀態,保證良好的充電效果;
5.定期檢查風扇皮帶的狀態,確保無損傷和處于正常的松緊度; 6.定期檢查冷卻液的狀態,確保滿足要求;
7.定期檢查或者更換柴油機機油,確保油位正常;
8.冬天寒冷季節要確保機組預熱裝置正常工作,以便在需要啟動發電機時能正常啟動;
來源:UPS電源專家www.tmdps.cn
www.tmdps.cn
www.tmdps.cn
第二篇:銀行電力中斷應急處置預案
電力中斷應急處置預案
為了確保網點正常營業和銀行自助設備的正常運行,網點應配備相當容量的發動機、不間斷電源和應急燈等應急設備,當營業網點發生突發性電力中斷時,應采取以下應急措施:
一、立即查明原因,首先網點負責人主動與供電部門聯系,查明供電部門是否停電,明確停電所需時間長短等情況,根據本網點不間斷電源供電情況確定是否發電;其次是委派會計查明屬本單位發生線路故障,應立即聯系農合行水電專職人員檢查本單位電力設施是否出現短路、斷路和人為破壞等情況,并組織當班后臺人員配合水電專職人員立即修復,及時恢復供電。
二、副行工立即與監控中心聯系,報告是否停電及恢復供電時間等情況,以便監控中心準確判斷發生停電或網絡故障。
三、在營業期間停電不能正常營業時,應開啟應急燈,安排外勤人員對顧客進行解釋,營業室、ATM機等重要部位安排外勤人員進行值守和巡查,防止他人進行趁機破壞。
四、恢復供電,檢查用電設施和營業設備是否正常;有無其他異常情況和安全隱患;屬營業時間,恢復對外營業。
第三篇:機房消防報警系統(應急預案)
消防報警系統及氣體滅火系統應急預案
機房消防系統包括火災自動報警及聯動控制系統,主機房采用IG541氣體滅火系統。
機房消防報警及滅火系統采用有管網全淹沒方式,并采用氣體滅火劑,探測器配置方式為智能感煙探測器、智能感溫探測器搭配,只有兩種探測器同時報警,氣體滅火系統才會發生聯動,同時還設有遠程手動啟動及機械手動方式。1 火災自動報警系統
火災自動報警系統是現代機房必不可少的組成部分,對火災采用多種方式進行探測、報警:
智能感煙探測器,它可通過連續上升的煙霧濃度確認火警的真實性,從而做到準確報警;
智能感溫探測器,當溫度到達一定溫度時,此探測器即會發出報警; 為保證系統中的探測器隨時能正常工作,系統對各類探測器隨時進行監測,一旦出現異常,將發出報警,提醒工作人員進行檢修、保養。2 自動控制系統
自動滅火系統由一臺高可靠性的智能型氣體滅火控制主機組成。主機集報警與氣體滅火控制于一體。各類探測器安裝在現場。
系統能對所屬設備進行自動檢查和定期自診斷;
系統接口及通信協議易于與其他系統相連;
監測系統具有自動巡檢功能,周期小于一秒;
當故障或火災發生時,中央監控系統有聲光報警信號,使值班人員迅速明確故障或火災發生的位置;
打印機自動記錄每次報警時間、位置及系統內所有設備狀態的變化和值班人員發出的指令。
在每個機房滅火區的入口、通道等有人通過的地方設緊急啟動按鈕,這樣可以通過手動將啟動信號及時的傳送到控制主機,將火災消滅在初期狀態,確保人員生命財產的安全。
3氣體滅火系統
(1)滅火方式
機房采用IG541氣體滅火系統的滅火方式,即在規定的時間內,噴射一定濃度的IG541氣體并使其均勻地充滿整個保護區,此時能將在其區域里任一部位發生的火災撲滅。
滅火系統的控制方式為自動、電氣手動、機械手動。
即在有人工作或值班時,應采用電氣手動控制,在無人的情況下,應采用自動控制方式,自動、手動控制方式的轉換,可在滅火控制盤上實現(在保護區的門外設置手動控制盤,手動控制盒內設有緊急停止與緊急啟動按鈕。
(2)保護區要求: 保護區耐壓強度>1200Pa;
保護區的通風系統在噴放滅火劑前應關閉,并設置防火閥門;
噴放氣體前,必須切斷可燃、助燃氣體的氣源,并停止一切影響滅火效果的設備;
在保護區外設置聲、光報警及釋放信號標志。
為保證人員的安全撤離,在釋放滅火劑前,應發出火災報警,火災報警至釋放滅火劑的延時時間為30秒。
為保證滅火的可靠性,在滅火系統釋放滅火劑之前或同時,應保證必要的聯動操作,即滅火系統在發出滅火指令時,由控制系統發出聯動指令,切斷電源、關閉或停止一切影響滅火效果的設備。
保護區應有排風設備,釋放滅火劑后,應將廢氣排盡后,人員方可進入進行檢修,廢氣未排盡前,如需進入作用區,則需佩帶氧氣呼吸器。
滅火系統的使用環境溫度為0℃~50℃。滅火啟動方式
本工程的滅火系統設計分為自動、電氣手動、機械手動三種情況; 自動情況:
即自動探測報警,發出火警信號,自動啟動滅火系統進行滅火; 電氣手動情況:
即自動探測報警,發出火警信號,經人工電氣手動啟動滅火系統執行滅火,上述自動情況的電氣手動情況的轉換在滅火控制盤上實現,然而不論滅火控制按鈕處于哪一種情況,當人為發出火警時,都可以使用該火警區的手動控制盒,電氣手動啟動滅火系統進行滅火。手動控制盒的另一項功能是它可以在滅火系統動作前,撤消滅火控制盤發出的本區域的指令,以防止不需由滅火系統進行滅火時啟動滅火系統。
機械手動情況: 只探測報警,發出火警信號,但電氣控制部分出現故障,不能執行滅火指令的情況下;
發現火警,由于電源發生故障或者自動探測報警系統失靈,不能執行滅火指令的情況下;
機械手動情況必須在鋼瓶間進行,首先拔去所需滅火區域的啟動裝置電磁閥上的保險,按下應急手柄,使滅火系統工作,執行滅火功能,但這務必在提前關閉影響滅火效果的設備,通知并確認人員已經撤離后方可實施。
無論什么情況下達指令,自指令下達后延時30s左右啟動滅火系統,以保證人員在規定的時間內從滅火區域內撤離,自滅火系統釋放七氟丙烷滅火劑時包括釋放后相當長的時間內,絕對不允許有人停留在滅火區域內。
滅火系統動作釋放滅火劑后,經檢驗確認火災已經撲滅的情況下,打開通風系統,向滅火作用區送入新鮮的空氣,廢氣排除干凈后,才允許人員進入。廢氣未排盡前,如需進入作用區,則需佩帶氧氣呼吸器。
滅火系統必須有專人負責,經常進行檢查和維護、保養,保持良好的工作狀況。滅火系統的IG541滅火劑儲瓶和啟動裝置充裝介質不允許發生泄漏,當滅火劑儲瓶,啟動裝置的壓力指示下降10%時,應及時充裝和更新,恢復正常工作狀況。
5應急行動的基本制度 a)值班制度
應急程序啟動后,應立即進行問題解決,需要較長時間的,應設相關人員24小時電話在線值班,必要時組織人員進行現場輪流值守。b)請示匯報制度
應急程序實施期間,所有成員在遇有重大情況和自身不能處理的事項應
立即向上級領導請示匯報。
1、工作程序 1)報警方式
向公司領導報告和當地消防隊報警,報警電話聯絡號碼:119(手機拔打:所在地的區號+)119 2)常規火災撲救、火災報警、報告與傷員救護的工作程序
(1)步驟
發現火情——立即高聲報警,聯絡附近的人員開展火情撲救工作——根據火情的嚴重程度,確定向當地消防部門求急(拔打119)——聯絡義務消防隊員——向公司報告——救助因火災而受傷的人員——火災撲滅后保護事故現場——公司指揮部門安排傷員的后勤保障——開展事故調查與處理工作。(2)急救方案
① 火情發現人員立即高聲報警,并首先考慮切斷電源線路(但必須此人懂得電工知識,如不懂,則不要冒險),附近的工作人員立即趕赴火災事故現場,如報警人沒有切斷電源,應先切斷電源,按照救火知識,正確使用滅火器材,開展救援工作,并注意自我防護。
② 現場的最高負責人作為現場的消防指揮員,指揮現場救援工作,根據火情的嚴重程度,確定當地消防部門求急(拔打119電話),聯絡業務消防隊員,指揮救火工作,向公司領導報告災情。
③ 如現場有人員受傷,應組織人員對傷者進行救護,必要時使用手機或其他通訊設施拔打“120”電話,與救護中心聯系,要求緊急救護。
④ 公司領導和質量安全辦公室接到報告后,立即趕到事故現場,并由專業的消防管理人員接替現場指揮工作,如消防隊趕到,應服從消防隊的指揮,直至災情得到控制并消除。
⑤ 質量安全辦公室在事后,如有傷者,要問清楚救護中心地點,與救護中心取得聯系,落實后勤保障工作,確保傷員能立即得到救護,不因后勤不到位而影響急救。
(3)在事故發生后,現場的最高負責人為現場的最高指揮人員,統一指揮與調度,最高指揮員應保持冷靜的頭腦,有序的指揮現場滅火,并在事故后報告事故經過。
(4)現場參與救火的人員,應積極參與緊急救援工作,服從指揮人員的指揮與調度,有救援經驗的人員要及時趕到事故現場,參加滅火救援,其他人員應保持現場的秩序,配合救援人員工作,并注意保護事故現場,事后配合調查組對事故進行調查。
4)電器設備的火災撲滅知識
初起火場所的撲滅:現場人員利用配備的滅火器材進行撲滅火災。
火勢較大的撲救:立即切斷火場電源,組織人員利用各種滅火器材進行撲救。當火勢不能控制時要進行火災報警,在報警中組織人員疏散火場上的爆炸物品和清理通道障礙,以保障消防車進入火場,全體人員協助消防隊撲救。
低壓、控制、保護等設備起火,初起火的設備,因斷電會造成嚴重影響,擴大事故的,可帶電滅火,撲救中使用干粉、1211、干砂滅火。為保證人身安全,應保證人體與帶電設備的距離,不得用水滅火。當火勢較大不能控制時要切斷電源,用水撲救,并進行火災報警。
2、消防滅火演練方法和過程控制
(1)消防報警和氣體滅火系統具有的三種控制方式
? 感溫、感煙火災探測器自動控制方式; ? 現場電氣手動控制方式;
? 鋼瓶間啟動裝置機械應急控制方式。(2)滅火演練程序
? 現場看到或接收到人員及消防主機的火情報警。(煙霧、探測器、警報聲)
? 值班人員要立即判斷真偽火警。若是假火警,查明原因;若是真火警,立即組織人員就近攜帶滅火器材趕到現場進行滅火,并通知消防總指揮及相關人員。
? 火勢不能控制時,立即按下機房門前的氣體滅火緊急啟動按鈕,進行滅火。并向社會尋求支援;火勢能控制時,增加滅火人員,以盡快撲滅。
? 滅火后保護好現場,并查明引起火災的原因。
第四篇:機房應急預案
應急處置方案
第一節 總 則
1、保證人員和財產的安全為前提的原則:在由于火災或電力問題造成的主機故障,在解決故障前,應以保證人員的生命安全和財產的安全為前提,然后進行故障的解決。
2、最快時間恢復業務的原則:本著先想盡一切方法,盡快恢復業務的原則來處理故障,如在有備用設備的情況下,主設備產生了故障,應先盡快將應用切換到備用機上,使業務能夠運行,再對故障設備進行診斷和維修。
3、故障應急人員高度負責的原則:當故障應急人員在節假日接到故障通知時,本著高度負責的態度,應迅速接手處理障礙,如遠程無法處理解決,應迅速趕到故障設備所在地,進行現場處理,處理故障的同時應及時向領導匯報。應急人員不可互相推卸責任,如因特殊情況,確實無法處理障礙,部門領導必須安排好其他人員處理。
4、盡可能全面的保留故障現場的原則:當故障發生后,應急人員應盡可能全面的備份出能夠反映故障現象的各種日志、記錄、受損文件等,便于業務恢復后,對故障的分析、解決,杜絕故障的再次發生。
應急方案的目標:保證預付卡運營系統連續安全穩定地運行。
第二節 應急領導小組
應急領導小組成員:
組 長: 副組長: 成 員:
第三節 電源系統故障應急處理
定期檢查信息中心機房電源設備的運行狀況,當發生下列突發事件時,按以下方案進行處置:
當中心機房發生市電供電突然停電或遠程報警電源異常時。首先確認是否為正常停電及預計停電時間。檢查不間斷電源的電池可供電時間,需在不間斷電源供電時效內關閉所有服務器及網絡設備。
聯系工程部查看停電原因,盡快恢復供電,并將情況報告相關領導
工程部聯系電話:
第四節 空調系統故障應急處理
定期對空調的運行情況進行檢查,如有報警信息,應及時查找故障原因,對于不能自行排除的問題,應及時與設備提供商進行聯系。
當中心機房主空調因故障無法制冷,致使機房內環境溫度超過攝氏40度時,打開機房房門,并關閉所有服務器及網絡設備。對于無法自行處置的空調系統異常情況,及時與設備提供商聯系,并報告公司領導。空調問題聯系人:
第五節 中心機房自動消防系統應急處理
當中心機房發生火警時,按以下方案進行處置:
1.上班工作時間發生火警,聽到自動消防系統發出的聲光報警后,中心機房附近辦公室人員應及時緊急撤離,避免氣體自動消防系統啟動后,消防氣體對附近人員造成人身傷害。確認火警后,立刻撥打119報警,并說明盡量使用氣體滅火器進行滅火,減少電子設備的損壞。
2.發生火警后,信息中心相關人員應馬上趕赴現場,并向有關領導報告事故情況。同時立即聯系聯通等相關公司,及時評估事故損失情況,研討盡快恢復信息系統正常運行的最佳方案。安保消防中控電話:
第六節 設備、網絡系統故障應急處理
設備、網絡應用系統故障應由發現人通知技術部,技術部門立即檢查故障,進行初步故障定位,解決;
1.網絡設備、服務器、儲存設備均有備份,當設備存在硬件問題時,可隨時把業務切換到備份主機上,保證業務正常運行; 2.應用系統每更新一次則做一次遠程備份,在遠程主機上分別備份舊的應用系統和更新后的應用系統,以當天的更新日期命名; 3.對磁盤柜上的數據庫文件有定時任務,每天凌晨4:00會把數據庫里的數據文件倒出到遠程備份主機上,以確保磁盤柜出現硬件故障的時候,數據文件不丟失;對于網絡、應用系統出現硬件方面的故障,比較嚴重的問題,對業務的正常運行造成較大的影響,立即向有關領導報告。
4、網絡中有監控服務器,運用Cacti v10最新的版本,監控網絡所有設備(路由器,防火墻,交換機以及服務器設備);對設備本身的硬件檢測、外部入侵檢測、外部攻擊等多種對系統不利因素以發送mail的形式報警;相關人員收到報警信息,分析收到的log日志以做出相應的處理。
5、每周周五對網絡設備進行日志及配置文件采集,對數據庫數據文件定期下載,和遠程備份;在本地電腦上保存最近的配置文件,以便在發生毀滅性的災難時,用來重組。
對簡單故障,運維人員應迅速排除故障,解決問題并記錄。如果需要更換設備,應上報有關領導,經批準后馬上更換故障設備,盡快恢復網絡、應用系統運行。運維部門判斷無法及時修理時,應立即通知相關的系統運行服務提供商,在最短的時間內安排修理或更換系統。
如發現屬外部線路的問題,應與線路服務提供商聯系,敦促對方盡快恢復故障線路。
啟用備份線路、設備、系統,迅速恢復相關的應用。
聯通聯系電話:
第七節 黑客入侵的應急處理
發現網絡上有黑客攻擊行為,任何人員都有義務向技術部門報告。技術部立即啟動應急響應,切斷受攻擊計算機與網絡的連接,停止一切操作、保護現場,并上報有關領導。
對于黑客攻擊,由計算中心組織應急響應專家小組查找入侵蹤跡,分析入侵方式和原因。由安全管理員根據對入侵事件的分析,組織相關人員對內部網計算機整改,防止黑客用同樣的手段再次入侵其他系統。安全管理員檢查確定無安全隱患后,才可將受攻擊計算機重新連接網絡,或啟用備份計算機來恢復應用。
安全管理員應做好記錄,保護現場,進行日志收集等工作。如果能追查到攻擊者的相關信息,可以對其發出警告,必要時可以采取進一步的行動,乃至采取法律手段。根據破壞程度,經有關領導同意后,上報公安部門。
若系統已被黑客破壞,無法恢復,應將受黑客攻擊的計算機上的重要數據備份到其他存儲介質,確保計算機內重要的數據不丟失。如果數據無法恢復,經有關領導同意后,可與國家指定的部門聯系,由他們來協助恢復,為保證數據信息安全,需在安全管理部門作記錄。
第八節 生產系統、數據庫故障處理
生產系統出現故障,技術部做出應急處理
1.因軟件設計缺陷、設計漏洞等引起的故障,通知公司研發部門在2小時內查明原因,解決問題。
2.數據庫出現故障,運維人員應在2小時內查清故障原因,其他相關部門應積極配合,解決問題。
3.如出現數據丟失情況,確認不能自行恢復后,啟用備份恢復數據,24小時內恢復運營。
本方案自發布之日起施行
第五篇:機房應急預案
中心機房突發事件應急預案
第一條
機房突發事件包括網絡設備或服務器故障、自然災害(水、火、電等)造成的 物理破壞、人為失誤造成的安全事件等等。針對突發事件的預防措施如下:
1.建立安全、可靠、穩定運行的機房環境,防火、防盜、防雷電、防水、防靜電、防塵; 建立備份電源系統;加強所有人員防火、防盜等基本技能培訓。
2.服務器采用可靠、穩定的硬件設備,落實數據備份機制,安裝有效的防病毒軟件,及時 更新升級掃描引擎;加強對局域網內所有用戶和信息系統管理員的安全技術培訓。
第二條
機房漏水應急預案如下:
1.發生機房漏水時,第一目擊者應立即通知機房管理人員。
2.若空調系統出現滲漏水,機房管理人員應立即安排停用故障空調,清除機房積水,并及 時聯系設備供應方處理,同時啟動備用空調,必要情況下可臨時用電扇對服務器進行降溫。3.若為墻體或窗戶滲漏水,機房管理人員應立即采取有效措施確保機房安全,同時安排通 知辦公室,及時清除積水,維修墻體或窗戶,消除滲漏水隱患。
第三條
機房火災應急預案如下:
1.完善機房環境,確保機房具備二氧化碳滅火器;禁止攜帶易燃易爆物品進入機房。2.機房管理人員應熟悉機房內部消防安全操作和規則,了解消防設備操作原理,掌握消防 應急處理步驟、措施和要領,懂得滅火的方法,會撲救初起火災,并定期組織滅火演習。3.一旦發生火災,迅速切斷機房電源,避免災情的擴散,并迅速撥打物業管理和119火警電話。
4.等待消防車到來期間,應組織物業保安或工作人員在保證安全的前提下滅火,應急領導小組應在第一時間內集中所有二氧化碳滅火器,抓住時機,盡可能的把火撲滅。
5.配合消防部門調查事故原因,對造成的損失和起火原因做好記錄,以便進行災后總結。
第四條
雷擊事故應急預案如下:
1.遇雷暴天氣,機房管理人員在下班后應及時關閉所有服務器,切斷電源,暫停內部計算 機網絡工作。
2.雷暴天氣結束后,機房管理人員應及時開通服務器,恢復內部計算機網絡工作,對設備 和數據進行檢查。出現故障的,事發部門應將故障情況及時報告機房管理人員。
3.因雷擊造成損失的,機房管理人員應會同相關部門進行核實、報損,并在調查工作結束 后一日內書面報告領導。
第五條
設備防盜被盜或人為損害應急預案如下:
1.機房管理人員每日查看、清點設備并鎖好機房大門。
2.機房管理人員每日檢查錄像監控服務器狀態,確保監控畫面正常,并檢查每日錄像正常性、完整性。
3.發生設備被盜或人為損害設備情況時,使用者或管理者應立即報告相關負責人,同時保護好現場。
4.機房維護人員接報后,通知保安及公安部門,一同核實審定現場情況,清點被盜物資或盤查人為損害情況,做好必要的影像記錄和文字記錄。
5.事發單位和當事人應積極配合公安部門進行調查,并將有關情況向機房管理人員匯報。
第六條
機房停電應急預案如下:
1.接到停電通知后,機房管理人員應及時通過辦公系統、電話等發布相關信息,部署應對具體措施,要求用戶在停電前停止業務、保存數據。
2.機房管理人員每日檢查UPS電源的狀態,確保在突發停電時,UPS電源能自動供應服務器正常工作半個小時,保證員工工作的數據及時保存。
第七條
通信網絡故障應急預案如下:
1.發生通信線路中斷、流量異常等故障后,員工應及時通知機房管理人員。
2.機房管理人員在接到報告后,迅速組織相關技術人員檢測故障區域,并作相關故障處理,必要時通知通信網絡運營商查清原因;逐步恢復故障區與服務器的網絡聯接,恢復通信網絡,保證正常運轉。
3.應急處理結束后,機房管理人員應在一日之內提交故障分析報告,以便備案。
第八條
服務器故障應急預案如下:
1.機房管理人員每日檢查服務器狀態,檢查郵箱服務器狀態,確保系統運行的完善。
2.機房管理人員定期備份服務器數據,并將備份資料刻錄成光盤或拷貝到移動硬盤。
第九條
1.發生機房突發事件后,機房管理人員應采取有效措施開展先期處置,恢復信息網絡正常狀態。應急處置工作結束后,機房管理人員對事件發生原因、性質、影響、后果、責任及應急處置能力、恢復重建等問題進行全面調查評估,根據應急處置中暴露出的管理、協調和技術問題,改進和完善預案,實施針對性演練,總結經驗教訓,整改存在隱患,組織恢復正常工作秩序。