第一篇:陜西BSC容災備份及無線專業紅橙黃_藍應急預案現_場演練總結報告
陜西BSC容災備份及無線網紅橙黃藍應急預案現場
演練總結報告
一、檢查組成員
組長:王粟(集團公司網絡部網絡監控處)無線專業專家:王玉國(浙江公司網絡優化中心)傳輸專業專家:張曉琳(遼寧公司網絡管理中心)
二、BSC容災備份演練
演練時間:2011年7月13日00:00-4:30 抽查網元:陜西西安BSC102 網元信息:西安BSC102覆蓋西安市長安區大學城區域,下掛基站16個,均為被容災基站,載波345套,其中VVIP基站3個,VIP基站3個,普通容災基站10個。被容災基站主要覆蓋財經學院和培華學院等話務密集的區域,符合集團關于被容災基站選擇原則的要求。演練內容:西安BSC102出現故障宕機,按照該BSC既定的容災備份方案,緊急將其下轄的被容災基站割接至西安BSC151下。演練過程:
? 00:00,現場演練檢查組長通知監控人員西安BSC102發生“宕機”故障,陜西公司網管中心監控組值班長將該演練故障按照省內重大故障級別上報,并通知應急人員到場。
? 0:25,網絡部、網管中心主管領導到場、西安分公司應急人員到現場,省內正式啟動容災備份應急倒換方案。
? 0:25,開始進行BSC102網管數據備份輸出,并開始目標BSC網管 數據制作和交換側數據制作;同時,依照VVIP-VIP-普通基站順序進行傳輸跳線布放。
? 0:55,利用機房應急跳線完成預定應急電路割接。? 1:03,首個VIP基站激活。? 1:20,全部VIP及VVIP基站激活。
? 1:30,開始VIP及VVIP基站下的撥打測試;經驗證,語音及數據業務均正常。
? 2:20,另外10個普通基站激活成功。
? 2:25,開始普通基站下的DT及CQT撥打測試,經驗證,語音及數據業務均正常。
? 2:55,啟動被容災基站的倒回操作。
? 4:30,完成所有被容災基站的倒回操作,業務驗證正常。演練小結:
按照既定的“容災備份”現場演練檢查方案,檢查組在審核完陜西公司的BSC容災備份應急預案后,首先對BSC核心機房進行了檢查,機房內具備一定比例的應急跳線,應急DDF端口有醒目標識,符合檢查辦法中的相關要求。
演練當晚在規定時限內完成了VIP及普通被容災基站的應急割接,從BSC模擬宕機到被容災基站完全割接至容災BSC,共割接基站16個,歷時1小時55分鐘,其中VVIP、VIP基站6個,歷時55分鐘;并于4點30分前完成了被容災基站及業務的正常倒回。演練共歷時4小時30分,基本實現了BSC容災備份的演練目標。存在問題:
1、陜西公司未配備專用容災BSC設備
陜西現有的容災備份方案是基于現網運行BSC的互備份,沒有專用的獨立容災BSC設備。由于現網業務負荷變動較為頻繁,現網有限的端口、傳輸等資源也需要經常隨之調整,目前很難完全滿足集團BSC100%容災的要求。
2、阿爾卡特設備數據裝載時間過長
根據統計,阿爾卡特設備割接目標BSC平均單站數據裝載時間約為5分鐘左右,同其他廠家設備相比歷時明顯較長。本次抽取的BSC下掛被容災基站數相對較少,若BSC下掛的被容災基站數量較多,將影響業務恢復時長。經驗總結:
1、在基于現網的BSC容災時,鑒于阿爾卡特設備的特性,容災BSC之間的相互對應關系可考慮歸屬同一OMC-R,割接時盡量減少BSC不必要進程、OMC-R不必要進程、減少LAC變更,避免切換關系混亂對網絡造成不穩定因素,縮短割接時長。
2、在每個容災BSC機房內均應部署用于容災的機架或空間來存儲足夠的容災光纜、端口和跳線、尾纖、備板等物資,以便于有效節約割接實施時間跨度,減小網絡阻斷時間。
3、在基于現網的容災割接前要注意做好備份PRC,對原始數據進行備份,認真核對端口及傳輸鏈路,不要隨意刪除改動被容災BSC的基站硬件,防止恢復后配臵出現問題。后續建議:
1、建議陜西公司網絡部協調計劃部部署BSC實體容災設備,達到BSC100%容災需求。
2、建議陜西公司與本省所有無線設備廠商共同研究BSC整體容災方案,并在條件具備時進行實戰演練,確保網絡業務及時恢復。
3、結合2011年上半年BSC宕機重大故障的實際情況,強烈建議總部網絡部適時向全網推動獨立BSC整體容災割接方案。附:本次容災割接測試情況
BSC102容災割接測試報告.docx
三、無線網紅橙黃藍應急預案演練
演練時間:2011年7月14日0:00-2:30 抽查網元:西安BSC213
網元信息:西安BSC213主要覆蓋長安區大學城部分區域,下掛基站15個,載波308套,其中VIP基站1個,符合網絡部應急通信處關于抽查網元的要求。
演練內容:西安BSC213出現LAC尋呼負荷過高的告警,省公司判斷符合本省無線網紅橙黃藍應急預案中的何種等級,啟動相應預案并進行現網操作。演練過程:
? 00:00,檢查組現場通知:陜西西安BSC213(卡特設備)LAC尋呼負荷達到滿負荷的85%,要求按“紅橙黃藍應急預案”啟動預案,并進行現網操作。
? 00:05,陜西網管中心監控班組按照本省無線網紅橙黃藍預案中預警級別判斷該情況符合藍色級別,按照流程進行上報。陜西公司高話務疏導小組設備組專家確定啟動藍色預案,通知相應應急人員到達現場。
? 00:20,應急人員緊急到達現場,通過預案指令操作,對高負荷設備及時快速進行疏導;同時監控班組將BSC相關情況對業務可能產生的影響情況按照既定的口徑向客服部門公布。? 00:35,應急措施實施完畢,并實時監控指標變化情況。? 01:05,檢查組現場通知:陜西西安BSC213(卡特設備)LAC尋呼負荷在啟動藍色預案后仍繼續升高,達到100%負荷,要求陜西公司按“紅橙黃藍應急預案”進一步處理。
? 01:08,陜西網管中心監控班組按照陜西公司紅橙黃藍預案中預警級別判斷該情況符合橙色級別,按照流程進行上報。陜西公司高話務疏導小組組長確定將原先藍色預案升級為橙色預案。? 01:20,按照預案,對BSC下掛基站按5-3級的次序對基站載波進行閉鎖,密切觀察,并準備好閉站操作;同時監控班組將BSC相關情況對業務可能產生的影響情況按照既定的口徑向客服部門公布。
? 01:40,應急措施實施完畢,BSC LAC尋呼負荷降至70%以下,觀察逐步穩定。
? 01:55,監控組報告話務應急小組,經檢查組確認,高話務應急小 組領導確定組織逐步實施倒回。
? 02:30,應急人員完成全部倒回,觀察業務量正常,指標正常。演練小結:
按照既定的“紅橙黃藍”應急預案的現場演練檢查方案,檢查組在審核完陜西公司的無線網“紅橙黃藍”應急預案后,模擬現網BSC高負荷情況,檢查了陜西公司無線網“紅橙黃藍”應急預案的實地演練情況。
演練顯示,針對核心網元高負荷,陜西公司預案等級判斷準確,預案啟動及時、應急操作較為完備、信息發布迅速;從演練開始至預案及操作全部倒回,共歷時2小時30分鐘,達到了演練的目的。問題及建議:
1、陜西公司無線網“紅橙黃藍”應急預案的觸發條件是BSC的CP負荷超門限或者LAC尋呼負荷超門限兩個條件,且各自門限不一,在緊急狀態下,監控及維護人員可能混淆或出現信息傳達不一致的情況。
建議陜西公司后續考慮將上述兩個觸發條件壓縮為一個對設備影響更為直接的觸發條件。
2、主動監控系統作為總部及各省監控類似可能需要啟動“紅橙黃藍”應急預案對應網絡問題的重要手段,其中阿爾卡特的BSC設備暫無法配臵CP負荷,陜西的監控人員目前僅能通過廠家設備的OMC-R等手段實施監控,對監控人員技能要求相對較高;
建議總部推動阿爾卡特廠家支持在主動監控系統中配臵“BSC設備的CP負荷”這一性能指標字段。
3、根據主動監控系統之前關于BSC 的數據需求規范,并無具體的LAC尋呼負荷值,陜西公司監控人員通過將尋呼負荷門限及不同廠家設備可支持的最大尋呼次數的絕對值換算成啟動“紅橙黃藍”預案時各自級別對應的尋呼次數來作為基線值;
鑒于當前設備替換及升版相對頻繁,對信息更新要求較高,建議總部推動相關處室要求網管廠家修改數據需求規范,統一配臵“BSC的LAC尋呼負荷”這一性能指標字段。