第一篇:災難恢復計劃制度
災難恢復計劃
一、災難的定義
災難分為自然災害和非自然災害。自然災害是指由火災、地震等引發的一系列災害直接導致公司的業務中斷、電力故障、網絡故障等。
非自然災害是指人為的造成的如服務器斷電、軟件錯誤、人為故意破壞、惡意代碼、木馬植入、恐怖襲擊等。
二、災難恢復項目小組的制定和職能
1.管理組:統籌規劃,指揮各小組按照既定計劃進行執行。
2.部門恢復組:負責制定各部門情況制定應急備案,確定各部門數據和財產的保護方式并執行保護,確定各部門數據的恢復方式并執行恢復。
3.計算機恢復組:負責對全公司范圍內的計算機故障進行排除、恢復范圍包括系統、必備辦公軟件。
4.損壞評估組:負責對公司損失的重要數據、財務進行總體評估。并針對相應損失的財產進行匯總并結合擁有的保險進行申報。
5.安全組:負責災難發生后的人員、數據、財務的安全進行保護。并制定相應的安全策略。
6.設備支持組:負責對公司服務器、網絡設備、交換機的故障進行排除,制定相應解決重建方案。
7、數據恢復組:負責對公司各平臺數據進行恢復,并制定相應數據恢復方案。
8、市場和客戶關系組:負責對外進行信息發布、制定相應應急措施應對客戶疑問等。各小組共同職能:
a)負責計劃的執行
b)與其它組之間進行信息交流,監督計劃的測試和執行 c)所有或是某一個成員可能領導特定的組 d)協調恢復過程
e)評估災難,執行恢復計劃,聯系組長 f)監控并記錄恢復的過程
三、業務恢復流程
(一)自然災害引起的災難恢復流程 由自然災害引起的災難往往影響較大,可能會直接導致一些基礎設施的無法使用,甚至會對導致人員減少。因此對于自然災害引發的災難恢復流程相對特殊且繁瑣。1.數據搶救
災難發生時,需在保證人身安全的情況對公司的重要數據進行搶救,搶救的范圍主要包括:記錄公司重要信息的文件、資料,存儲公司重要數據的磁帶,存放重要數據的硬盤、服務器。此過程需由安全組進行統籌指揮,按照既定的計劃執行,各組成員、公司員工必須服從安全組的統一調度和指揮。2.損壞評估及啟動應預案
災難發生后各小組需根據情況匯報損失情況給損壞評估組,損壞評估組根據匯總信息進行消息告知披露。披露損壞信息包括: a)公司重要生產、監視測量、辦公設備
b)擁有在可以執行計劃之內的關鍵性功能的員工 c)保存公司重要數據的介質 d)網絡、通訊設備
各小組人員根據披露的損壞信息情況進行應急預案啟動,如選舉臨時領導、使用備份服務器、備份通訊設備進行替代等。3.業務恢復計劃
業務恢復計劃需要多個小組支持與配合,總體可劃分為以下幾個階段: a)IT基礎設施恢復階段:
此階段主要的目標是將對于保存數據的基礎設施、業務系統所在的主機、公司網絡架構進行恢復。首先須根據損失評估小組給出的報告分析可繼續利用的IT基礎設施,如供電設施、交換機、服務器、防火墻等。若有損壞不可用的設備,需及時同代理商進行溝通借用或新購相應設備。此階段由設備支持組執行。
b)系統恢復階段:
系統恢復主要針對關鍵應用主機,如金蝶軟件。為節約時間需同時針對各個服務器系統進行快速恢復。此階段由數據恢復組執行。
c)網絡恢復階段:
網絡恢復階段的主要針對以下幾點進行:
? 關鍵商業應用系統的內部局域網和網絡設備的支持 ? 外部廣域網和電信服務
? 待恢復系統和終端用戶(公司同事)間的通訊 此階段由數據恢復組同設備支持組共同執行。
d)業務平臺恢復階段:
在此階段的恢復工作主要圍繞日常工作常用的業務平臺進行,常用的業務平臺主要為:企業QQ、QQMail、OA、ERP等。平臺恢復的工作分為兩個部分:
? 業務系統數據恢復 ? 業務系統重搭建 ? 業務系統數據導入 業務系統數據恢復: 數據恢復小組首先須對業務系統的數據進行恢復,需要尋找相應的恢復設備完成此操作,目前我們主要利用硬盤和可正常工作的主機進行數據恢復工作。需要將搶救出的硬盤接連在對應設備上恢復出數據。
業務系統重搭建: 為提高業務恢復效率,數據恢復小組成員需分工協作,共同完成業務系統的重搭建工作,由于一些業務系統的特殊性,需盡快與相應平臺的供應商接口人取得聯系,并申請臨時可用的加密狗、許可文件等。各個平臺負責人需對自己管理的平臺在短時間
內進行重搭建。業務系統數據導入:
數據恢復小組成員需根據導出的數據結合自己管理的業務平臺進行數據導入,并測試可行性。再導入成功并可使用后及時同個小組成員負責人進行通知。
(二)非自然災害引起的災難恢復流程
非自然災害引起的災難恢復通常破壞較小,但是風險程度仍不可忽視,如電力故障導致的關鍵業務系統無法運行同樣會給我們的公司帶來一定的影響。但由于破壞程度的不同,我們將引入業務持續計劃(BCP)這樣一個概念。
業務持續計劃是為了防止正常業務行為的中斷而被建立的計劃。當面對由于人為造成的故障或災難以及由此造成的財產損和正常業務不能正常使用時,BCP主要被設計用來保護關鍵業務步驟。BCP是最小化對于業務的干擾效果和使業務能恢復正常運行的計劃。
RTO(Recovery Time Object)恢復時間是指EIA部門同公司簽訂的故障響應恢復時間,如確保在1小時內排除故障,使業務系統重新恢復工作。
RPO(Recovery Point Objective)恢復點目標,該指標規定在災難發生后,公司所能夠容忍的數據丟失量,該指標由EIA部門同公司簽訂。
對于RTO和RPO目標的實現,需要人力、物力的支持,因此對于高效,最小化的BCP指標,往往也會花費大量的財力資源。在執行業務持續計劃的同時,由于造成的災難和破壞性并不嚴重,因此可直接進入業務平臺恢復階段。
第二篇:災難恢復計劃
部署災難恢復計劃時最易忽略的九大事
件
2011-07-09 15:52來源:論壇論壇我要評論(0)
? 摘要:本文簡單的介紹了在部署災難恢復計劃時比較容易忽略那些,而忽略了這些對企業會造成怎樣的損失呢?這是難以想象的,本文就為大家列出了在部署災難恢復計劃時最易忽略的九大事件。? 標簽:災難恢復計劃
?誰都知道用有一個有效的災難恢復計劃的重要性。那么,在部署災備方案的時候,有哪些重要的因素被忽視了?基于對數以千計的中小型用戶的調查,我們列出了大家最易忽略的九件事。
1.沒有考慮到可能會破壞基礎設施和數據運行的所有可能性
除了顯而易見的病毒,木馬,蠕蟲等威脅,還需要想到您所處的地理位置發生自然災害的可能性,比如是否處于地震斷層或是在洪水區,風暴多發區,或拉閘限電等等。在制定災備計劃時,一定要把這些看似與IT無關的因素也考慮進去,如果自然條件實在太惡劣,勸您可以考慮換個地方建設數據中心。
2.災備計劃過于依賴很少的某幾個員工
常常看到有些企業的 災難恢復計劃依賴于某幾個甚至一個IT員工,這很危險。萬一如果該人由于某種原因無法工作或者剛好找不到他/她怎么辦?您需要確定員工也得有“備份”,矩 陣式結構的雇員組織形式會更好的做出應急響應。而且負責災備的員工分布的地理位置最好是分散的,以防某一地區發生重大災害。
3.故障或災難來臨時,依靠手工流程通知工作人員
假設您的設備由于停電而終斷運行,可是現場又沒有人,負責災備的IT人員怎么會知道機房停電了?您需要建立一套自動化的系統,發生災難或者服務終斷時它可以自動的通知您的IT員工。你還可以選擇第三方服務,請服務商來監控您的設施并且指派受過災備培訓的專業人員來幫你執行你的災難恢復計劃。
4.未能提供充足的后備電源
如果您的機房所在地常受到斷電影響,一定要購買壽命最長的、最不易受干擾而間斷的電力供應。還要準備好額外的備用電池以保證業務的持續能力。
5.忘記安排哪些資源需要優先恢復
您的IT應用中,哪些是最重要的?是否有一些可以等待一兩天也不會影響到業務?你需要事先安排好應用與服務的恢復順序。比如,你可以選擇首先重啟您公司的電子郵件應用,然后再恢復部門文件服務器。在安排這個順序時,你需要考慮到相關的法規遵從要求.6.未制定規范災難恢復計劃流程文檔
在制訂了一套災備計劃之后,您一定要把如何執行恢復計劃的步驟寫下來,要詳細到每一個進程以及記錄,描述所有系統資源的位置。這個災備恢復步驟手冊一定要多印幾份,并且存儲在多個不同的地方,并確保所有關鍵恢復人員人手一份。
7.忘記測試災難恢復計劃
確保恢復計劃在有緊急狀況時真的可以恢復出來!雖然這似乎是顯而易見的事,但是許多企業都忽視了這一點,沒有充分測試他們的災備恢復計劃。應該定期進行災難演習,測試每種可能發生的情況,從基本的電力故障到可能導致持續幾個月的重大災難性事件。
8.密碼也很難找到
雖然密碼保護是數據安全的重要環節,不過還是建議您最好至少在兩個不同的、安全的地方保存您的系統密碼。確保一個以上的IT工作人員的人有機會進入那里,并能獲得所有密碼。并且,如果這些關鍵人員辭職了,一定要及時更改密碼。
9.未能保持恢復計劃的更新
您需要不斷更新您的災難恢復計劃,至少一個季度要再看一次。確定調用該計劃的觸發點,如人員、設備、地點或應用的改變等等。這不僅有利于IT工作人員的技能保持更新,還將讓你有機會發現災備計劃程序中的漏洞并優化之。
以上就是為大家總結的在部署災難恢復計劃時最容易忽略的問題,希望通過本文的內容能對大家有所幫助。
第三篇:災難恢復計劃V1.0
災難恢復計劃
一、災難的定義
災難分為自然災害和非自然災害。
自然災害是指由火災、地震等引發的一系列災害直接導致公司的業務中斷、電力故障、網絡故障等。
非自然災害是指人為的造成的如服務器斷電、軟件錯誤、人為故意破壞、惡意代碼、木馬植入、恐怖襲擊等。
二、災難恢復項目小組的制定和職能
1.管理組:統籌規劃,指揮各小組按照既定計劃進行執行。2.部門恢復組:負責制定各部門情況制定應急備案,確定各部門數據和財產的保護方式并執行保護,確定各部門數據的恢復方式并執行恢復。
3.計算機恢復組:負責對全公司范圍內的計算機故障進行排除、恢復范圍包括系統、必備辦公軟件。
4.損壞評估組:負責對公司損失的重要數據、財務進行總體評估。并針對相應損失的財產進行匯總并結合擁有的保險進行申報。5.安全組:負責災難發生后的人員、數據、財務的安全進行保護。并制定相應的安全策略。
6.設備支持組:負責對公司服務器、網絡設備、交換機的故障進行排除,制定相應解決重建方案。
7、數據恢復組:負責對公司各平臺數據進行恢復,并制定相應數據恢復方案。
8、市場和客戶關系組:負責對外進行信息發布、制定相應應急措施應對客戶疑問等。各小組共同職能: a)負責計劃的執行
b)與其它組之間進行信息交流,監督計劃的測試和執行 c)所有或是某一個成員可能領導特定的組 d)協調恢復過程
e)評估災難,執行恢復計劃,聯系組長 f)監控并記錄恢復的過程
三、災難恢復流程
(一)自然災害引起的災難恢復流程
由自然災害引起的災難往往影響較大,可能會直接導致一些基礎設施的無法使用,甚至會對導致人員減少。因此對于自然災害引發的災難恢復流程相對特殊且繁瑣。1.數據搶救
災難發生時,需在保證人身安全的情況優先對公司的重要數據進行搶救,搶救的范圍主要包括:記錄公司重要信息的文件、資料,存儲公司重要數據的磁帶,存放重要數據的硬盤、服務器。此過程需由安全組進行統籌指揮,按照既定的計劃執行,各組成員、公司員工必須服從安全組的統一調度和指揮。2.損壞評估及啟動應預案
災難發生后各小組需根據情況匯報損失情況給損壞評估組,損壞評估組根據匯總信息進行消息告知披露。披露損壞信息包括: a)公司重要生產、監視測量、辦公設備 b)擁有在可以執行計劃之內的關鍵性功能的員工 c)保存公司重要數據的介質 d)網絡、通訊設備
各小組人員根據披露的損壞信息情況進行應急預案啟動,如選舉臨時領導、使用備份服務器、備份通訊設備進行替代等。3.業務恢復計劃
業務恢復計劃需要多個小組支持與配合,總體可劃分為以下幾個階段: a)IT基礎設施恢復階段:
此階段主要的目標是將對于保存數據的基礎設施、業務系統所在的主機、公司網絡架構進行恢復。首先須根據損失評估小組給出的報告分析可繼續利用的IT基礎設施,如供電設施、交換機、服務器、防火墻等。若有損壞不可用的設備,需及時同代理商進行溝通借用或新購相應設備。此階段由設備支持組執行。
b)系統恢復階段:
系統恢復主要針對關鍵應用主機,如Rasd-server、IBM、Center-server、BJTCT。為節約時間需同時針對各個服務器系統進行快速恢復。此階段由數據恢復組執行。
c)網絡恢復階段: 網絡恢復階段的主要針對以下幾點進行:
? 關鍵商業應用系統的內部局域網和網絡設備的支持 ? 外部廣域網和電信服務
? 待恢復系統和終端用戶(公司同事)間的通訊 此階段由數據恢復組同設備支持組共同執行。d)業務平臺恢復階段:
在此階段的恢復工作主要圍繞日常工作常用的業務平臺進行,常用的業務平臺主要為:Winmail、Change、Doors、Synergy、OA、ERP等。平臺恢復的工作分為兩個部分:
? 業務系統數據恢復 ? 業務系統重搭建 ? 業務系統數據導入 業務系統數據恢復:
數據恢復小組首先須對業務系統的數據進行恢復,需要尋找相應的恢復設備完成此操作,目前我們主要利用磁帶機和可正常工作的主機進行數據恢復工作。需要將搶救出的磁帶和硬盤接連在對應設備上恢復出數據。
業務系統重搭建:
為提高業務恢復效率,數據恢復小組成員需分工協作,共同完成業務系統的重搭建工作,由于一些業務系統的特殊性,需盡快與相應平臺的供應商接口人取得聯系,并申請臨時可用的加密狗、許可文件等。各個平臺負責人需對自己管理的平臺在短時間 內進行重搭建。
業務系統數據導入:
數據恢復小組成員需根據導出的數據結合自己管理的業務平臺進行數據導入,并測試可行性。再導入成功并可使用后及時同個小組成員負責人進行通知。
(二)非自然災害引起的災難恢復流程
非自然災害引起的災難恢復通常破壞較小,但是風險程度仍不可忽視,如電力故障導致的關鍵業務系統無法運行同樣會給我們的公司帶來一定的影響。但由于破壞程度的不同,我們將引入業務持續計劃(BCP)這樣一個概念。
業務持續計劃是為了防止正常業務行為的中斷而被建立的計劃。當面對由于人為造成的故障或災難以及由此造成的財產損和正常業務不能正常使用時,BCP主要被設計用來保護關鍵業務步驟。BCP是最小化對于業務的干擾效果和使業務能恢復正常運行的計劃。
RTO(Recovery Time Object)恢復時間是指EIA部門同公司簽訂的故障響應恢復時間,如確保在1小時內排除故障,使業務系統重新恢復工作。
RPO(Recovery Point Objective)恢復點目標,該指標規定在災難發生后,公司所能夠容忍的數據丟失量,該指標由EIA部門同公司簽訂。
對于RTO和RPO目標的實現,需要人力、物力的支持,因此 對于高效,最小化的BCP指標,往往也會花費大量的財力資源。在執行業務持續計劃的同時,由于造成的災難和破壞性并不嚴重,因此可直接進入業務平臺恢復階段。
一. 日常備份檢查
1.日常服務主機按時定期做備份,分為兩類:
主機備份:主機備份應在每周,確認服務運行正常后,制定備份計劃和類型,并指定備份時間應為網絡最空閑時。在自動執行計劃后,應確認備份是否完整,是否有錯誤
數據備份:數據備份應做每日備份,確定需要備份的數據庫,制定每日備份和備份類型。每日,數據庫管理人員應對前一日的備份,進行檢查,確認備份是否成功完整。
2.日常備份檢查
日常備份檢查應由網絡部主管人員不定期或定期指定檢查,查看備份時間是否符合備份規定,備份文件是否完整,存放是否規整。
3.備份空間檢查
日常由網絡管理人員檢查備份空間是否充足,如空間緊張,應提前把距離最遠的備份文件,存放至指定存儲介質中,網絡部管理人員應對存儲介質存放進行檢查,查看存放空間是否達到防潮防磁,并對存儲介質進行封存 災難恢復制度:
1.災難級別劃分
A類:計算機軟硬件故障
發生概率:對于企業,發生可能性最大。由于設備長時間運行,升級硬件所造成。狀況有(服務停止,正常業務不能辦理)
B類:人為操作故障
發生概率:日常工作中員工對于本部門的資源進行更新或維護,由于不正當操縱或誤操縱造成文件損壞或丟失。狀況有(個別部門文件丟失,使得部門正常辦公受到阻礙)
C類:資源不足引起的計劃性停機
發生概率:由于操縱系統軟件或硬件資源不足所造成的系統;服務宕機,造成的數據丟失或損壞。狀況有(服務器無法正常提供服務,重啟后無效,需要轉移服務,升級維修服務器)
2.相對應級別的處臵方法
當發生時。應先報告網絡維護人員,由災難鑒定小組進行災難鑒定,確定災難級別,上報災難小組組長,并對災難發生時間,解決方法,恢復時間進行記錄。
2.1 發生A類災難時,災難鑒定人員確定災難級別后,上報災難恢復組組長,確定恢復方案,排除硬件原因,在主機正常啟動后,檢查缺失的文件或不能正常啟動的服務,上報災難組組長,并準備備份文件,進行恢復。進行恢復后,由恢復后檢查人員檢查主機是否恢復正常服務,文件是否完整且可以被正常訪問,檢查無誤后。上報災難恢復小組組長,并對災難恢復的過程進行記錄。
2.2 發生B類災難時,災難發現人應及時上報網絡部及災難恢復小組組長,明確丟失的文件,確定文件丟失原因,并對丟失原因和責任人進行記錄。由丟失文件部門提出書面“恢復文件申請”,由災難鑒定確定丟失文件,在災難恢復小組組長批準后,準備備份文件恢復。恢復后,由丟失文件所在部門進行確認。
2.3 當發生C類災難,由災難鑒定人員確定主機故障,并上報災難恢復小組組長:
2.3.1 確認為主機操縱系統故障或硬件資源不足所引起宕機時,先確認該主機是否為應用服務器(如是應用服務器,應先斷開該主機的網絡連接),如有需要,應及時轉移服務,由其他服務器代為承接業務。故障主機再進行維修。
2.3.2 如確認系統不能正常運行,但通過短時間維護(不超過2小時)可以恢復正常,報請災難恢復小組組長,并對原因進行說明。在得到批準后,實行對主機的全面恢復(在斷開主機網絡連接后,回復到最近一次的正常備份狀態)。在恢復后由恢復檢查人員對主機進行檢查,確認主機確實恢復后,再接入網絡,恢復后檢查人員應在48小時內對恢復后的主機密切關注,確實恢復正常后,報告災難恢復小組組長。并對主機恢復情況留有詳細記錄,以備后續檢查
第四篇:信息系統災難恢復計劃
XXXX有限公司文件
信息系統災難恢復計劃
為應對突發的各項災難(如:地震、強臺風、洪水、地坑等自然災難和恐怖分子、黑客等人為破壞),保障電腦、網絡信息安全,做好反恐工作,特制定本計劃。
一、信息系統災難恢復組織機構:
成立“信息系統反恐小組” 專門應對信息系統災難恢復。組長:XXX(行政部經理)電話:XXX
副組長;XX(保安主管)電話:XX
組員;
XXX(電腦工程師、網管)電話:XXX
XXX(機要室機要員)電話:XX
XXX(專業電工)電話:XXXX
XXX(生產部經理)電話:XXX
XXX(樣品管理主管)電話:XXXX
XXXX(設計師)電話:XXXX
二、信息系統災難恢復時間要求:
為保障設計、開發、生產的正常運行,一旦發生信息系統災難,立即啟動信息系統反恐應急預案,確保在4小時內恢復信息系統。
三、信息系統反恐應急預案
1.信息系統災難發生時,應在第一時間向“信息系統反恐小組”報告報告電話:6021137
2.信息系統反恐小組接到報告后,按如下分工,各就各位,展開工作:XXX;全面負責信息系統災難恢復中的協調、指揮、人員分工、材
料供應等各項工作。
XXX;負責電訊、網絡公司的溝通、協調工作,并按反恐預案的要
求,組織保安人員做好廠區各項反恐工作。
XXX:負責電腦消除病毒,系統及網絡恢復、文件和數據的拷貝,保證信息系統及時運作。
XXX:機房、機柜、線路的硬件更換、修復。
XXX、XXX、XXXX、XXXX、XXXX:
在電腦工程師指導下,分別負責制作一部、制作二部樣品管
理部門、設計部、行政部和機要室、財務部的電腦消除病毒,系
統及網絡恢復、文件和數據的拷貝,保證信息系統及時運作。
3.信息系統災難檢查、驗收:
由“信息系統反恐小組”牽頭,會同設計、開發、生產、銷售、財務部門經理,在信息系統災難恢復結束時進檢查、驗收。
四、規范管理,認真做好信息系統災難預防工作
1.一般工作機不安裝軟驅和光驅,如有安裝軟驅和光驅的計算機,每次使用磁盤都要用殺毒軟件檢查。.對于聯網的計算器,任何人在未經批準的情況下,不得向電腦
內拷入軟件或文件。.重要資料存入數據庫中,并每日備份,數據的備份由機要室機要員管理,備份用的硬盤交公司電腦網絡管理工程師保管。.軟盤光盤等在使用前,必須確保無病毒。.電腦一經發現病毒,應立即通知機要室機要員處理。.操作員在離開前應退出系統并關機。.任何人未經操作員本人同意,不得使用他人的計算機。
8.裝有軟驅的電腦一律不得入網;對于尚未聯網電腦,其軟件的安裝由機要室負責、任何電腦需安裝軟件時,由相關人員負責
人提出書面報告,經經理同意后,由機要室負責安裝;軟件出
現異常時,應通知機要室機要員處理;所有電腦不得安裝游戲
軟件;數據的備份由機要室機要員管理,備份用的軟盤由電腦
工程師負責人提供。
9.硬件維護人員在拆卸電腦時,必須由專業人員負責所有微機的檢測和清理工作,采取必要的防靜電措施;硬件維護人員在作
業完成后或準備離去時,必須將所拆卸的設備復原;要求各專
業負責人認真落實所轄電腦及配套設備的使用的保養責任;要
求各專業負責人采取必要措施,確保所用的電腦及外設始終處于整潔和良好的狀態;所有帶鎖的電腦,在使用完畢或離去前必須上鎖;對于關鍵的電腦設備應配備必要的斷電保護電源。
10.所有電腦不得上網,上網統一到機要室,在機要員的管理下
專機上網。電子郵件的收發,統一由機要室管理。除機要室電腦外所有電腦的外接口全部封閉。
11.密碼由機要室統一設置,并每季定期更換密碼,如發現密碼己
泄漏,就盡快更換,做好保密和存檔記錄。
12.不要隨便運行或刪除電腦上的文件或程序。
13.對公司辭職人員的電腦由負責人立即更改電腦密碼,保密電腦
內文件。
五、每半年一次信息系統災難應急培訓、研討。
六.每半年一次信息系統災難應急演習。
XXXXX有限公司
2011年2月14日
第五篇:災難恢復計劃
災難恢復計劃
一、災難的定義
災難分為自然災害和非自然災害。
自然災害是指由火災、地震等引發的一系列災害直接導致學校業務中斷、電力故障、網絡故障等。
非自然災害是指人為造成的如服務器斷電、軟件錯誤、人為故意破壞、惡意代碼、木馬植入、恐怖襲擊等。
二、災難恢復項目小組的制定和職能
1、管理組:統籌規劃、指揮各小組按照既定計劃進行執行。
2、部門恢復組:負責制定各部門情況制定應急備案,確定各部門數據和財產的保護方式并執行保護,確定各部門數據的恢復方式并執行恢復。
3、計算機恢復組:負責對全校范圍內的計算機故障進行排除、恢復,范圍包括系統、必備辦公軟件。
4、損壞評估組:負責對學校損失的重要數據、財務進行總體評估。并針對相應損失的財產進行匯總并結合擁有的保險進行申報。
5、安全組:負責災難發生后的人員、數據、財務的安全進行保護,并制定相應的安全策略。
6、設備支持組:負責對學校服務器、網絡設備、交換機的故障進行排除,制定相應解決重建方案。
7、數據恢復組:負責對學校各平臺數據進行恢復,并制定相應數據恢復方案。
8、市場和家長關系組:負責對外進行信息發布、制定相應應急措施應對家長疑問。各小組共同職能: A)負責計劃的執行
B)與其他組之間進行信息交流,監督計劃的測試和執行 C)所有或是某一個成員領導特定的組 D)協調恢復過程
E)評估災難,執行恢復計劃,聯系組長 F)監控并記錄恢復的過程
三、業務恢復流程
(一)自然災害引起的災難恢復流程
由自然災害引起的災難往往影響較大;可能直接導致一些基礎設施的無法使用,甚至會導致人員減少。因此對于自然災害引發的災難恢復流程相對特殊且繁瑣。
1、數據搶救
災難發生時,需在保證人身安全的情況下對學校的重要數據迸行搶救,搶救的范圍主要包括:記錄學校重要信息的文件、資料,存儲學校重要數據的磁帶,存放重要數據的硬盤和服務器。此過程由安全組進行統籌指揮,按照既定的計劃執行,各組成員、學校員工必須服從安全組的統一調度和指揮。
2、損壞評估及啟動應急預案 災難發生后各小組需根據情況匯報損失情況給損壞評估組。損壞評估組根據匯總信息進行消息告知披露。披露損壞信息包括:
A)學校重要生產、監視測量、辦公設備
B)擁有在可以執行計劃之內的關鍵性功能的員工 C)保存學校重要數據的介質 D)網絡通訊設備
各小組人員根據披露的損壞信息情況進行應急預案啟動,如選舉臨時領導、使用備份服務器、備份通訊設備替代等。
3、業務恢復計劃
業務恢復計劃需要多個小組支持與配合,總體可劃分為以下幾個階段:
A)IT基礎設施恢復階段
此階段主要的目標是將對于保存數據的基礎設施、業務系統所在的主機、學校網絡構架進行恢復。首先須根據損失評估小組給出的報告分析可以繼續利用的IT基礎設施,如供電設施、交換機、服務器、防火墻等。若有損壞不可用的設備,需及時同代理商進行溝通或新購相應設備。此階段由設備支持組執行。B)系統恢復階段
系統恢復階段主要針對應用主機,如Rasd-server、IBM、Center-server、BJTCT。為節約時間需同時針對各個服務器系統進行快速恢復,此階段由數據恢復組執行。C)網絡恢復階段
網絡恢復階段主要針對以下幾點進行:關鍵商業應用系統的內部局域網和網絡設備的支持;外部廣域網和電信服務;待恢復系統和終端用戶(學校同事)間的通訊。此階段由數據恢復組和設備支持組共同執行。D)業務平臺恢復階段:
在此階段的恢復工作主要圍繞日常工作常用的業務平臺進行,常用的業務平臺主要為:Winmail、Change、Doors、Synergy、OA、ERP等。平臺恢復的工作分為三個部分: 業務系統數據恢復:
數據恢復小組首先須對業務系統的數據進行恢復,需要尋找相應的恢復設備完成此操作,目前我們主要利用磁帶機和可正常運作的主機進行數據恢復工作。需要將搶救出的磁帶和硬盤接連在對應設備上恢復出數據。業務系統重搭建:
為提高業務恢復效率,數據恢復小組成員需分工協作,共同完成業務系統的重搭建工作。由于一些業務系統的特殊性,需盡快與相應平臺的供應商接口人取得聯系,并申請臨時可用的加密狗、許可文件等。各個平臺負責人需對自己管理的平臺在短時間內進行重搭建。業務系統數據導入: 數據恢復小組成員需根據導出的數據結合自己管理的業務平臺進行數據導入,并測試數據可行性。在導入成功并可使用后及時對各小組成員負責人進行通知。
(二)非自然災害引起的災難恢復流程
非自然災害引起的災難通常破壞較小,但是風險程度仍然不可忽視。如電力故障導致關鍵業務系統無法正常運行同樣會給我們的學校帶來一定的影響。但由于破壞程度的不同,我們將引入業務持續計劃(BCP)這樣一個概念。
業務持續計劃是為了防止正常業務行為的中斷而被建立的計劃。當面對由于人為造成的故障或災難以及由此造成的財產損失和正常業務不能正常使用時,BCP主要被設計用來保護關鍵業務步驟。BCP是最小化對于業務的干擾效果和使業務能恢復正常運行的計劃。
RTO(Recovery Time Object)恢復時間是指EIA部門同學校簽訂的故障響應恢復時間,如確保在1小時內排除故障,使業務系統重新恢復工作。
RPO(Recovery Point Object)恢復點目標,該指標規定在災難發生后,學校所能夠容忍的數據丟失量,該指標由EIA部門同學校簽訂。
對于RTO和RPO目標的實現,需要人力、物力的支持,因此對于高效,最小化的BCP指標,往往也會花費大量的財力資源,在執行業務持續計劃的同時,由于造成災難和破壞性并不嚴重,因此可直接進入業務平臺恢復期。