第一篇:分布式存儲系統(tǒng)設(shè)計方案——備份容災(zāi)
分布式存儲系統(tǒng)設(shè)計方案——備份容災(zāi)
在分布式存儲系統(tǒng)中,系統(tǒng)可用性是最重要的指標(biāo)之一,需要保證在機器發(fā)生故障時,系統(tǒng)可用性不受影響,為了做到這點,數(shù)據(jù)就需要保存多個副本,并且 多個副本要分布在不同的機器上,只要多個副本的數(shù)據(jù)是一致的,在機器故障引起某些副本失效時,其它副本仍然能提供服務(wù)。本文主要介紹數(shù)據(jù)備份的方式,以及 如何保證多個數(shù)據(jù)副本的一致性,在系統(tǒng)出現(xiàn)機器或網(wǎng)絡(luò)故障時,如何保持系統(tǒng)的高可用性。數(shù)據(jù)備份
數(shù)據(jù)備份是指存儲數(shù)據(jù)的多個副本,備份方式可以分為熱備和冷備,熱備是指直接提供服務(wù)的備副本,或者在主副本失效時能立即提供服務(wù)的備副本,冷備是用于恢復(fù)數(shù)據(jù)的副本,一般通過Dump的方式生成。
數(shù)據(jù)熱備按副本的分布方式可分為同構(gòu)系統(tǒng)和異步系統(tǒng)。同構(gòu)系統(tǒng)是把存儲節(jié)點分成若干組,每組節(jié)點存儲相同的數(shù)據(jù),其中一個主節(jié)點,其他為備節(jié)點;異 構(gòu)系統(tǒng)是把數(shù)據(jù)劃分成很多分片,每個分片的多個副本分布在不同的存儲節(jié)點,存儲節(jié)點之間是異構(gòu)的,即每個節(jié)點存儲的數(shù)據(jù)分片集合都不相同。在同構(gòu)系統(tǒng)中,只有主節(jié)點提供寫服務(wù),備節(jié)點只提供讀服務(wù),每個主節(jié)點的備節(jié)點數(shù)可以不一樣,這樣在部署上會有更大的靈活性。在異構(gòu)系統(tǒng)中,所有節(jié)點都是可以提供寫服務(wù) 的,并且在某個節(jié)點發(fā)生故障時,會有多個節(jié)點參與故障節(jié)點的數(shù)據(jù)恢復(fù),但這種方式需要比較多的元數(shù)據(jù)來確定各個分片的主副本所在的節(jié)點,數(shù)據(jù)同步機制也會 比較復(fù)雜。相比較而言,異構(gòu)系統(tǒng)能提供更好的寫性能,但實現(xiàn)比較復(fù)雜,而同構(gòu)系統(tǒng)架構(gòu)更簡單,部署上也更靈活。鑒于互聯(lián)網(wǎng)大部分業(yè)務(wù)場景具有寫少讀多的特 性,我們選擇了更易于實現(xiàn)的同構(gòu)系統(tǒng)的設(shè)計。
系統(tǒng)數(shù)據(jù)備份的架構(gòu)如下圖所示,每個節(jié)點代表一臺物理機器,所有節(jié)點按數(shù)據(jù)分布劃分為多個組,每一組的主備節(jié)點存儲相同的數(shù)據(jù),只有主節(jié)點能提供寫 服務(wù),主節(jié)點負責(zé)把數(shù)據(jù)變更同步到所有的備節(jié)點,所有節(jié)點都能提供讀服務(wù)。主節(jié)點上會分布全量的數(shù)據(jù),所以主節(jié)點的數(shù)量決定了系統(tǒng)能存儲的數(shù)據(jù)量,在系統(tǒng) 容量不足時,就需要擴容主節(jié)點數(shù)量。在系統(tǒng)的處理能力上,如果是寫能力不足,只能通過擴容主節(jié)點數(shù)來解決;而在寫能力不足時,則可以通過增加備節(jié)點來提 升。每個主節(jié)點擁有的備節(jié)點數(shù)量可以不一樣,這在各個節(jié)點的數(shù)據(jù)熱度不一樣時特別有用,可以通過給比較熱的節(jié)點增加更多的備節(jié)點實現(xiàn)用更少的資源來提升系 統(tǒng)的處理能力。
同步機制
在上面的備份架構(gòu)中,每個分組只有主節(jié)點接收寫請求,然后由主節(jié)點負責(zé)把數(shù)據(jù)同步到所有的備節(jié)點,如下圖所示,主節(jié)點采用一對多的方式進行同步,相 對于級聯(lián)的方式,這種方式在某個備節(jié)點故障時,不會影響其它備節(jié)點的同步。在CAP理論中,可用性和一致性是一對矛盾體,在這里主節(jié)點執(zhí)行寫操作后會立即 回復(fù)客戶端,然后再異步同步數(shù)據(jù)到備節(jié)點,這樣并不能保證主備節(jié)點的數(shù)據(jù)強一致性,主備數(shù)據(jù)會有短暫的不一致,通過犧牲一定的一致性來保證系統(tǒng)的可用性。在這種機制下,客戶端可能在備節(jié)點讀到老數(shù)據(jù),如果業(yè)務(wù)要求數(shù)據(jù)強一致性,則可以在讀請求中設(shè)置只讀主選項,這樣讀請求就會被接口層轉(zhuǎn)發(fā)到主節(jié)點,這種情 況下備節(jié)點只用于容災(zāi),不提供服務(wù)。
為了保證主備節(jié)點的數(shù)據(jù)一致性,需要一種高效可靠的數(shù)據(jù)同步機制。同步分為增量同步和全量同步,增量同步是主節(jié)點把寫請求直接轉(zhuǎn)發(fā)到備節(jié)點執(zhí)行,全量同步是主節(jié)點把本地的數(shù)據(jù)發(fā)到備節(jié)點進行覆蓋。接下來詳細介紹同步機制的實現(xiàn),同步的整體流程如下圖所示。
系統(tǒng)中數(shù)據(jù)分片的單位是一致性哈希環(huán)中的VNode(虛擬節(jié)點),每個VNode有一個自增的同步序列號SyncSeq,VNode中所包含的數(shù)據(jù) 的每一個寫操作都會觸發(fā)它的SyncSeq進行自增,這樣在每個VNode內(nèi)SyncSeq就標(biāo)識了每一次寫操作,并且SyncSeq的大小也反映了寫操 作的執(zhí)行順序。數(shù)據(jù)的每次寫操作除了修改數(shù)據(jù),還會保存寫操作對應(yīng)的SyncSeq,后面可以看到,SyncSeq是同步機制可靠性的基礎(chǔ)。
主節(jié)點的寫進程收到寫請求后,先修改數(shù)據(jù),把當(dāng)前VNode的SyncSeq加1并更新到數(shù)據(jù)中。接下來會記錄Binlog,Binlog是一個三元組
主備節(jié)點的數(shù)據(jù)同步由主節(jié)點上的同步進程異步進行,通過掃描上圖的同步進度表中主備節(jié)點的SyncSeq差異就可知備節(jié)點需要同步哪些數(shù)據(jù)。同步進程通過同步進度表確定需要同步的二元組
接下來介紹一下同步協(xié)議如何保證同步的高效和可靠。為了讓同步包嚴格按照主節(jié)點的發(fā)送順序到達備節(jié)點,采用TCP協(xié)議進行同步,在主節(jié)點的每個 VNode上到每一個備節(jié)點建立一個TCP連接,記為一個同步連接。在每一個同步連接上,主節(jié)點會一次性批量發(fā)送多個同步包,備節(jié)點也會記錄已同步的 SyncSeq,對每一個同步包會檢查攜帶的SyncSeq是否符合預(yù)期,如果符合預(yù)期,則執(zhí)行同步寫操作,執(zhí)行成功是更新已同步的SyncSeq,在這 種情況寫備節(jié)點也不需要回應(yīng)主節(jié)點,主節(jié)點在未收到備節(jié)點的回應(yīng)時,會認為同步一切正常。只有以下異常情況下,備節(jié)點才會回應(yīng)主節(jié)點:
在正常同步后第一次收到錯誤的SyncSeq,回應(yīng)主節(jié)點自己所期望的SyncSeq,主節(jié)點收到回應(yīng)后,會從備節(jié)點所期望的SyncSeq開始同步,需要注意的是,備節(jié)點在連續(xù)收到錯誤SyncSeq時,只需對第一個錯誤回應(yīng),否則主節(jié)點會出現(xiàn)重復(fù)同步的情況;同步連接在斷連后重新連接時,備節(jié)點告知主節(jié)點自己所期望開始同步的SyncSeq,主節(jié)點從該SyncSeq開始同步;SyncSeq符合期望但執(zhí)行出錯,一般是增量同步才可能出現(xiàn),備節(jié)點回應(yīng)主節(jié)點同步出錯,主節(jié)點收到回應(yīng)后,把出錯的同步包改為全量同步。
在增量同步和全量同步交叉進行的情況下,如果某次全量同步已同步了最新的數(shù)據(jù),后續(xù)的增量同步可能導(dǎo)致寫操作重復(fù)執(zhí)行,為了避免這種情況,備節(jié)點會 校驗同步包中的SyncSeq和數(shù)據(jù)中的SyncSeq,如果前者不大于后者,說明數(shù)據(jù)已執(zhí)行了這次寫操作,直接跳過不執(zhí)行,也不需要回應(yīng)主節(jié)點,這就是 為什么需要在數(shù)據(jù)中保存SyncSeq的原因。
通過上面介紹和分析,可以看出采用同步連接、批量同步的方法,正常情況下只有單向的同步流量,是非常高效的;而在異常情況下,通過出錯回應(yīng)、SyncSeq校驗等機制,保證了同步的可靠性。容災(zāi)機制
如果系統(tǒng)需要具有容災(zāi)能力,即在機器發(fā)生故障時,系統(tǒng)的可用性基本不受影響,那么系統(tǒng)中所有數(shù)據(jù)至少需要有兩個以上的副本,并且系統(tǒng)的處理能力要有 一定的冗余,需要保證在故障機器不能提供服務(wù)時,系統(tǒng)不會過載。一般來說,數(shù)據(jù)的副本數(shù)量越多,系統(tǒng)的處理能力越冗余,系統(tǒng)的容災(zāi)能力越強。更進一步,還 需要考慮物理部署,通過把數(shù)據(jù)的不同副本分布在不同機架、不同機房、甚至是不同城市,來把系統(tǒng)的容災(zāi)能力提升到不同的級別。
配置運維中心會監(jiān)控系統(tǒng)存儲層所有節(jié)點的狀態(tài),存儲節(jié)點會定時上報心跳,如果配置運維中心在一段時間未收到某個存儲節(jié)點的心跳,則把該節(jié)點的狀態(tài)標(biāo) 記為故障,并進行故障處理流程。首先需要禁止故障節(jié)點繼續(xù)提供服務(wù),即通知接口層不再把客戶端請求轉(zhuǎn)發(fā)的故障節(jié)點,如果故障節(jié)點是主節(jié)點,配置運維中心會 查詢并對比所有備節(jié)點的同步進度,選擇數(shù)據(jù)最新的備節(jié)點,將其切換為主節(jié)點。由于所有備節(jié)點也會記錄Binlog,所以在切換為主節(jié)點之后,可以直接向其 它備節(jié)點進行同步。這里的主備切換可能會導(dǎo)致少量的數(shù)據(jù)丟失,如果業(yè)務(wù)不能容忍這樣的數(shù)據(jù)丟失,則需要使用其它強一致性的方案。
在容災(zāi)切換之后,還需要進行故障節(jié)點的恢復(fù),以便系統(tǒng)恢復(fù)到正常的狀態(tài)。故障機器恢復(fù)后,就會進入死機恢復(fù)流程,無論故障節(jié)點在故障前是主節(jié)點還是 備節(jié)點,故障恢復(fù)后的角色都是備節(jié)點。首先待恢復(fù)節(jié)點需要把機器上所有的數(shù)據(jù)清空;接著主節(jié)點會把當(dāng)前所有VNode的SyncSeq復(fù)制到待恢復(fù)節(jié)點,并且全量復(fù)制所有數(shù)據(jù);在全量復(fù)制完成之后,開始進行數(shù)據(jù)同步,由前面的同步機制可知,同步的SyncSeq會從之前復(fù)制到待恢復(fù)節(jié)點的狀態(tài)開始追趕;在 主節(jié)點和待恢復(fù)節(jié)點之間的SyncSeq差異縮小到正常范圍時,待恢復(fù)節(jié)點的角色就變?yōu)閭涔?jié)點,開始提供服務(wù)。
配置運維中心會監(jiān)控主備節(jié)點之間的SyncSeq差異,如果某個備節(jié)點差異達到一定的閾值,則禁止該備節(jié)點提供服務(wù),如果差異在比較長的時間之后仍然無法恢復(fù),則會觸發(fā)死機恢復(fù)流程。數(shù)據(jù)回檔
最后再簡單介紹下數(shù)據(jù)冷備和回檔,主要是由備份系統(tǒng)負責(zé)。備份任務(wù)一般是手動或定時發(fā)起,屬于業(yè)務(wù)級別的,備份系統(tǒng)收到一個業(yè)務(wù)的備份任務(wù)后,會遠 程備份業(yè)務(wù)的所有數(shù)據(jù),過程比較簡單,就是遍歷所有的存儲節(jié)點,把屬于該業(yè)務(wù)的所有數(shù)據(jù)寫入到遠程文件系統(tǒng)中,每次備份都需要記錄開始時間和結(jié)束時間,作 為數(shù)據(jù)回檔的基準(zhǔn)。
系統(tǒng)中所有的寫操作都會記錄一份遠程的流水,每條流水都記錄了寫操作的時間戳,由流水中心統(tǒng)一存儲。結(jié)合數(shù)據(jù)冷備和流水,可以恢復(fù)到冷備完成后任意 時刻的數(shù)據(jù)。備份系統(tǒng)收到一個業(yè)務(wù)回檔任務(wù)后,首先停止該業(yè)務(wù)的服務(wù),然后清空業(yè)務(wù)的所有數(shù)據(jù),接著從冷備做一次全量的恢復(fù),然后再重放流水到指定時間 點,即可完成數(shù)據(jù)回檔。需要注意的是這里的冷備并不是快照,在進行冷備的時候,寫操作也正常執(zhí)行,所以從冷備開始時間重放流水會導(dǎo)致很多的寫操作重復(fù)執(zhí) 行,這里通過數(shù)據(jù)版本校驗來避免這個問題,在數(shù)據(jù)中保存了版本信息,在寫操作流水中也記錄了對應(yīng)的寫操作完成后的數(shù)據(jù)版本,重放流水的時候,如果流水中記 錄的版本不比數(shù)據(jù)中的版本新,則直接跳過這條流水,這樣就保證了數(shù)據(jù)回檔的準(zhǔn)確性。
第二篇:數(shù)據(jù)容災(zāi)備份設(shè)計方案
數(shù)據(jù)容災(zāi)備份設(shè)計方案
1.1數(shù)據(jù)備份的主要方式
目前比較實用的的數(shù)據(jù)備份方式可分為本地備份異地保存、遠程磁帶庫與光盤庫、遠程關(guān)鍵數(shù)據(jù)+定期備份、遠程數(shù)據(jù)庫復(fù)制、網(wǎng)絡(luò)數(shù)據(jù)鏡像、遠程鏡像磁盤等六種。
(1)本地備份異地保存
是指按一定的時間間隔(如一天)將系統(tǒng)某一時刻的數(shù)據(jù)備份到磁帶、磁盤、光盤等介質(zhì)上,然后及時地傳遞到遠離運行中心的、安全的地方保存起來。
(2)遠程磁帶庫、光盤庫
是指通過網(wǎng)絡(luò)將數(shù)據(jù)傳送到遠離生產(chǎn)中心的磁帶庫或光盤庫系統(tǒng)。本方式要求在生產(chǎn)系統(tǒng)與磁帶庫或光盤庫系統(tǒng)之間建立通信線路。(3)遠程關(guān)鍵數(shù)據(jù)+定期備份
本方式定期備份全部數(shù)據(jù),同時生產(chǎn)系統(tǒng)實時向備份系統(tǒng)傳送數(shù)據(jù)庫日志或應(yīng)用系統(tǒng)交易流水等關(guān)鍵數(shù)據(jù)。(4)遠程數(shù)據(jù)庫復(fù)制
生產(chǎn)系統(tǒng)相分離的備份系統(tǒng)上建立生產(chǎn)系統(tǒng)上重要數(shù)據(jù)庫的一個鏡像拷貝,通過通信線路將生產(chǎn)系統(tǒng)的數(shù)據(jù)庫日志傳送到備份系統(tǒng),使備份系統(tǒng)的數(shù)據(jù)庫與生產(chǎn)系統(tǒng)的數(shù)據(jù)庫數(shù)據(jù)變化保持同步。(5)網(wǎng)絡(luò)數(shù)據(jù)鏡像
是指對生產(chǎn)系統(tǒng)的數(shù)據(jù)庫數(shù)據(jù)和重要的數(shù)據(jù)與目標(biāo)文件進行監(jiān)控與跟蹤,并將對這些數(shù)據(jù)及目標(biāo)文件的操作日志通過網(wǎng)絡(luò)實時傳送到備份系統(tǒng),備份系統(tǒng)則根據(jù)操作日志對磁盤中數(shù)據(jù)進行更新,以保證生產(chǎn)系統(tǒng)與備份系統(tǒng)數(shù)據(jù)同步。(6)遠程鏡像磁盤
利用高速光纖通信線路和特殊的磁盤控制技術(shù)將鏡像磁盤安放到遠離生產(chǎn)系統(tǒng)的地方,鏡像磁盤的數(shù)據(jù)與主磁盤數(shù)據(jù)以實時同步或?qū)崟r異步方式保持一致。磁盤鏡像可備份所有類型的數(shù)據(jù)。
1.2備份拓撲網(wǎng)絡(luò)結(jié)構(gòu)
廣州市第八人民醫(yī)院具有兩個不同地點的中心機房(即東風(fēng)東路院區(qū)中心機房和嘉禾院區(qū)中心機房),在這基礎(chǔ)上是可以構(gòu)建一個異地容災(zāi)的數(shù)據(jù)備份系統(tǒng),以確保本單位的系統(tǒng)正常運營及對關(guān)鍵業(yè)務(wù)數(shù)據(jù)進行有效地保護,以下設(shè)計方案僅提供參考。
東風(fēng)東院區(qū)數(shù)據(jù)中心
windows
windows
linux
linux
嘉禾院區(qū)數(shù)據(jù)中心
Windows
linux
本方案中,我們采用EMC的CDP保護技術(shù)來實現(xiàn)數(shù)據(jù)的連續(xù)保護和容災(zāi)系統(tǒng)。1.在東風(fēng)東院區(qū)數(shù)據(jù)中心部署一臺EMC 480統(tǒng)一存儲平臺,配置一個大容量光纖磁盤存儲設(shè)備,作為整個系統(tǒng)數(shù)據(jù)集中存儲平臺。
2.在嘉禾院區(qū)數(shù)據(jù)中心部署一臺EMC 480統(tǒng)一存儲系統(tǒng),配置一個大容量光纖磁盤存儲設(shè)備,作為整個平臺的災(zāi)備存儲平臺。
3.兩地各部署兩臺EMC RecoverPoint/SE RPA,采用CLR技術(shù),即CDP(持續(xù)數(shù)據(jù)保護)+CRR(持續(xù)遠程復(fù)制),實現(xiàn)并發(fā)的本地和遠程數(shù)據(jù)保護。
4.在東風(fēng)東院區(qū)數(shù)據(jù)中心本地采用EMC RecoverPoint/SE CDP(持續(xù)數(shù)據(jù)保護)技術(shù)實現(xiàn)本地的數(shù)據(jù)保護。5.兩地采用EMC RecoverPoint/SE CRR(持續(xù)遠程復(fù)制)技術(shù),實現(xiàn)遠程的數(shù)據(jù)保護。由于兩地之間專線的帶寬有限,可以采用EMC Recoverpoint/SE異步復(fù)制技術(shù),將東風(fēng)東院區(qū)數(shù)據(jù)中心EMC480上的數(shù)據(jù)定時復(fù)制到嘉禾院區(qū)數(shù)據(jù)中心。根據(jù)帶寬的大小,如果后期專線帶寬有所增加,RecoverPoint會自動切換同步、異步、快照時間點三種復(fù)制方式,盡最大可能保證數(shù)據(jù)的零丟失。
1.3本地數(shù)據(jù)數(shù)據(jù)保護(CDP)設(shè)計
如上圖所示,當(dāng)服務(wù)器對生產(chǎn)卷有寫命令操作時,存儲系統(tǒng)將需要寫入的數(shù)據(jù)寫入到存儲的同時,利用CLARIION拆分器(Spliter)將寫命令同時傳送一份到RPA上,RPA收到寫命令返回寫成功給服務(wù)器,同時將數(shù)據(jù)連同時間戳、應(yīng)用事件、或標(biāo)簽等一并寫入日志卷,RPA再根據(jù)日志卷信息分布地將數(shù)據(jù)寫入復(fù)制卷。1.4遠程數(shù)據(jù)復(fù)制過程(CRR)設(shè)計
如上圖所示,當(dāng)服務(wù)器對生產(chǎn)卷有寫命令操作時,存儲系統(tǒng)將需要寫入的數(shù)據(jù)寫入到存儲的同時,利用CLARIION拆分器(Spliter)將寫命令同時傳送一份到RPA上,RPA收到寫命令返回寫成功給服務(wù)器,經(jīng)過RPA處理(對數(shù)據(jù)進行壓縮,壓縮率可以達到15倍左右),通過專線網(wǎng)絡(luò)將數(shù)據(jù)傳送到嘉禾院區(qū)數(shù)據(jù)中心的RecoverPoint設(shè)備處,形成歷史快照后,再寫入到嘉禾院區(qū)中心的的EMC 480磁盤陣列系統(tǒng)中,保持與東風(fēng)東院區(qū)數(shù)據(jù)中心EMC 480陣列上的數(shù)據(jù)一致性。
1.5數(shù)據(jù)恢復(fù)過程設(shè)計
本地恢復(fù):在本地如發(fā)生服務(wù)器故障、數(shù)據(jù)損壞、軟件錯誤、病毒和最終用戶錯誤等常見問題造成的數(shù)據(jù)丟失,利用本地的CDP即可快速恢復(fù)到任意時間點的數(shù)據(jù)。
異地恢復(fù):我們建議在嘉禾院區(qū)數(shù)據(jù)中心配置與東風(fēng)東院區(qū)本地系統(tǒng)相同的應(yīng)用服務(wù)器做為備用,一旦東風(fēng)東院區(qū)本地數(shù)據(jù)中心災(zāi)難發(fā)生,由于數(shù)據(jù)已經(jīng)傳送到嘉禾院區(qū)數(shù)據(jù)中心,我們直接將數(shù)據(jù)附加到已配置好的災(zāi)備服務(wù)器上,配置好網(wǎng)絡(luò)路由等細節(jié),即可啟動應(yīng)用,恢復(fù)原業(yè)務(wù)系統(tǒng)。
RecoverPoint/SE不經(jīng)過主機不影響主機性能,無須安裝任何軟件,完全完全獨立的運行。通過IP 網(wǎng)絡(luò),搭建數(shù)據(jù)容災(zāi)架構(gòu),延長了容災(zāi)的距離,充分利用現(xiàn)有資源,完成數(shù)據(jù)的容災(zāi)保護,為保障數(shù)據(jù)的高安全性和可靠性打下良好基礎(chǔ)。1.6 RecoverPoint/SE容災(zāi)方案技術(shù)優(yōu)勢
RecoverPoint/SE采用了獨創(chuàng)的領(lǐng)先技術(shù),是一個先進的企業(yè)級災(zāi)難恢復(fù)解決方案。該方案以相對低廉的造價提供完善的數(shù)據(jù)保護,RecoverPoint的結(jié)構(gòu)是基于SAN和IP之間的支持雙向數(shù)據(jù)復(fù)制的智能化獨立設(shè)備,并可以在任意距離上為異構(gòu)服務(wù)器環(huán)境提供數(shù)據(jù)復(fù)制。該方案具有以下特點:
1.帶寬節(jié)約和數(shù)據(jù)壓縮 2.利用IP網(wǎng)絡(luò)進行數(shù)據(jù)復(fù)制 3.支持超長距離的數(shù)據(jù)復(fù)制 4.支持基于策略的數(shù)據(jù)復(fù)制 5.能夠恢復(fù)到任意時間點 6.支持雙向的數(shù)據(jù)復(fù)制
7.支持靈活的容災(zāi)數(shù)據(jù)中心的檢查和批處理 8.長距離的“同步”解決方案
9.通過綜合的手段,降低總體擁有成本
具體技術(shù)優(yōu)勢如下描述: 帶寬節(jié)約和數(shù)據(jù)壓縮
RecoverPoint/SE采用了智慧型的“帶寬約減”技術(shù),使得系統(tǒng)對帶寬的需求達到了空前降低。這就可以在現(xiàn)有的網(wǎng)絡(luò)帶寬環(huán)境下提供最高程度的數(shù)據(jù)復(fù)制,這一點最大幅度地降低了對WAN需求的成本,尤其是基于遠距離的數(shù)據(jù)復(fù)制。通過storage-aware和application-aware算法技術(shù),可以達到高效的數(shù)據(jù)壓縮能力(可達到15:1的壓縮比),從而降低對傳輸帶寬的需求,這一點是傳統(tǒng)的數(shù)據(jù)壓縮技術(shù)所無法比擬的。
任意時間點的應(yīng)用程序數(shù)據(jù)保護
RecoverPoint/SE 允許通過選擇特定于時間或特定于應(yīng)用程序的智能書簽將應(yīng)用程序數(shù)據(jù)恢復(fù)到任意時間點。選定時間點的應(yīng)用程序數(shù)據(jù)可以進行即時訪問,并且立即可供主機讀取和寫入。還可以在設(shè)定數(shù)量的已分配存儲中使用快照整合來實現(xiàn)更長的保留期,使客戶能夠在線維護更多數(shù)據(jù)以便恢復(fù),而不引入額外的存儲成本。RecoverPoint/SE 還允許在不中斷復(fù)制過程的情況下對復(fù)制的數(shù)據(jù)進行讀/ 寫訪問。在恢復(fù)時,該功能允許測試幾個時間點的數(shù)據(jù),以便確定最佳恢復(fù)點。該功能也可用于減輕備份負擔(dān)、允許進行實時應(yīng)用程序開發(fā)和測試、支持按需恢復(fù)、遷移數(shù)據(jù)及其他許多有價值的數(shù)據(jù)處理。
RecoverPoint/SE 可保護來自 Microsoft、Oracle、SAP?、VMware? 等的常見應(yīng)用程序。它還支持應(yīng)用程序一致性恢復(fù)點(使用 Virtual Data Interface for SQL Server 或 Volume Shadow CopyService for Exchange 等 Microsoft 要求的 API),從而讓這些環(huán)境實現(xiàn)供應(yīng)商支持的恢復(fù)。
確保數(shù)據(jù)的一致性
RecoverPoint保證在任何可能的故障或災(zāi)難中對企業(yè)數(shù)據(jù)進行一致性的復(fù)制。當(dāng)前的許多產(chǎn)品無法確保數(shù)據(jù)在“多次同步”或“重復(fù)性災(zāi)難”發(fā)生的情況下保持數(shù)據(jù)的一致性。RecoverPoint可以確保在任何時間,甚至在異構(gòu)存儲和服務(wù)器的環(huán)境下仍然保持數(shù)據(jù)一致性。
策略化的數(shù)據(jù)復(fù)制
RecoverPoint提供了全面的數(shù)據(jù)復(fù)制機制,同時提供同步、異步以及時間點復(fù)制。復(fù)制過程按照用戶的策略自動管理,并動態(tài)調(diào)整復(fù)制過程,按照可用帶寬、每個應(yīng)用的工作量來為每個應(yīng)用達到一定的數(shù)據(jù)復(fù)制要求,從而在復(fù)雜或異構(gòu)環(huán)境中極大地簡化了數(shù)據(jù)和災(zāi)難恢復(fù)的管理難度。
比如,針對數(shù)據(jù)保護要求比較苛刻的應(yīng)用,我們可以為其定義一種“最小延遲”的復(fù)制策略。這樣,系統(tǒng)會利用所有可用的帶寬資源來實現(xiàn)主從節(jié)點之間數(shù)據(jù)復(fù)制。另外,我們也可以為非關(guān)鍵業(yè)務(wù)定制“最小帶寬”的復(fù)制策略,使得系統(tǒng)利用盡可能少的帶寬資源,實現(xiàn)關(guān)鍵數(shù)據(jù)和相對非關(guān)鍵數(shù)據(jù)的不同策略處理。
遠距離的同步保護
RecoverPoint提供了數(shù)據(jù)的同步保護級別,對應(yīng)用性能無影響,距離無限,同時對存儲設(shè)備無需額外的花費。該特有功能解決了當(dāng)前方案對距離限制的問題,并實現(xiàn)了對區(qū)域性災(zāi)難的完整的實時數(shù)據(jù)保護,同時不會降低應(yīng)用性能。
雙向的數(shù)據(jù)復(fù)制能力
RecoverPoint提供了雙向的數(shù)據(jù)復(fù)制能力,因此能夠使主數(shù)據(jù)中心和容災(zāi)中心互為保護。例如,大型公司在不同的地方擁有分公司,各分公司都具有數(shù)據(jù)中心,都有應(yīng)用數(shù)據(jù)需要保護,此時,可以互相將自己的數(shù)據(jù)復(fù)制到對方的數(shù)據(jù)中心,而共同使用同一套容災(zāi)基礎(chǔ)設(shè)施和軟件。
從節(jié)點的數(shù)據(jù)處理
RecoverPoint支持從節(jié)點數(shù)據(jù)的直接讀取和寫入操作,而無需預(yù)先從主節(jié)點產(chǎn)生拷貝。系統(tǒng)支持故障切換和數(shù)據(jù)回滾的能力,降低管理和操作成本。
始終可用和無限擴展性
RecoverPoint支持高可用集群技術(shù),是Active-Active模式的獨立體系,這樣可以保持系統(tǒng)始終可用,并可以無限擴展。
整體成本優(yōu)勢
RecoverPoint提供了強大的數(shù)據(jù)保護功能,但是在整體成本上遠遠低于當(dāng)前方案。同時,異構(gòu)存儲的支持、帶寬的降低、軟件、結(jié)構(gòu)及操作維護等等都為用戶提供了更為節(jié)約的解決之道。
便于管理
RecoverPoint支持NDMP管理協(xié)議,便于在其他應(yīng)用或再開發(fā)中加以集成。同時RecoverPoint具有豐富的故障報告機制,圖形化的界面使得管理更加便利。
日常管理界面如下圖所示:簡潔明了,便于管理
第三篇:容災(zāi)備份建議書(推薦)
醫(yī)院信息系統(tǒng)容災(zāi)備份建議書
一、概述
二十一世紀的醫(yī)院已經(jīng)逐漸發(fā)展為現(xiàn)代化的綜合性醫(yī)院,為了實現(xiàn)醫(yī)院管理的科學(xué)化、現(xiàn)代化、數(shù)字化,與國際、國內(nèi)信息化建設(shè)的新技術(shù)接軌,適應(yīng)現(xiàn)代化醫(yī)院的醫(yī)療、科研、教育和管理的要求,現(xiàn)代化的醫(yī)院所建立起的信息系統(tǒng)(HIS)主要以一體化的臨床系統(tǒng)、LIS系統(tǒng)、PACS系統(tǒng),EIS系統(tǒng)、PIS系統(tǒng)等為基礎(chǔ),實現(xiàn)數(shù)據(jù)全面共享,共同形成全面的醫(yī)院信息管理系統(tǒng)。龐大的系統(tǒng)必然產(chǎn)生海量數(shù)據(jù),對于軟件系統(tǒng)而言數(shù)據(jù)就是根本,任何操作、分析、結(jié)算等等都從數(shù)據(jù)庫中提取。從某種意義上說,數(shù)據(jù)安全成為了現(xiàn)代醫(yī)院信息系統(tǒng)安全的重中之重。一旦數(shù)據(jù)丟失,對任何一家醫(yī)院來說都會產(chǎn)生重大的影響。
二、項目立項的必要性及市場需求分析
近幾年,國家各部委對數(shù)據(jù)信息安全都有相關(guān)的明確規(guī)定!頒布了如下一系列條例,如《國家信息化領(lǐng)導(dǎo)小組關(guān)于加強信息安全保險工作的意見》,《計算機信息系統(tǒng)安全保護條例》、《信息安全等級保護管理辦法》、《2006―2020年信息化發(fā)展戰(zhàn)略》、《信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范》、《保險業(yè)信息系統(tǒng)災(zāi)難恢復(fù)管理指引》、《銀行業(yè)信息系統(tǒng)災(zāi)難恢復(fù)管理規(guī)范》、《民用航空重要信息系統(tǒng)災(zāi)難備份與恢復(fù)管理規(guī)范》、《重要信息系統(tǒng)災(zāi)難恢復(fù)規(guī)劃指南》。在2010年11月,北京衛(wèi)生局聯(lián)合公安局等部門下發(fā)了《關(guān)于開展信息安全等級保護安全建設(shè)整改工作的實施方案》的通知,該通知中也明確提出了數(shù)據(jù)備份的安全等級保護,并要求需要在重點單位發(fā)揮試點示范作用。由此可見各行業(yè)已經(jīng)開始注重容災(zāi)備份的重要性了!
對于關(guān)乎國計民生的醫(yī)院行業(yè),政府更是大力監(jiān)管,在2011年推出的“《三級綜合醫(yī)院評審標(biāo)準(zhǔn)(2011 年版)》(衛(wèi)醫(yī)管發(fā)〔2011〕33號)”文件中的第五大點第四條就明確規(guī)定了“實施國家信息安全等級保護制度,實行信息系統(tǒng)操作權(quán)限分級管理,保障網(wǎng)絡(luò)信息安全,保護患者隱私。推動系統(tǒng)運行維護的規(guī)范化管理,落實突發(fā)事件響應(yīng)機制,保證業(yè)務(wù)的連續(xù)性。” 該部分就已經(jīng)包含了容災(zāi)備份及業(yè)務(wù)連續(xù)性管理的要求,從等級保護的要求而言,二級及以上的等級保護也是要求要做備份及業(yè)務(wù)連續(xù)性管理的,還需要有應(yīng)急的制度、程序流程和災(zāi)難演練。
醫(yī)院信息系統(tǒng)運行中可能出現(xiàn)的突發(fā)性故障和問題
1、系統(tǒng)硬件故障
如數(shù)據(jù)/系統(tǒng)磁盤的損壞將導(dǎo)致數(shù)據(jù)不能訪問,并進而可能導(dǎo)致應(yīng)用進程終止或系統(tǒng)停機,甚至系統(tǒng)不能重啟動;網(wǎng)卡的損壞可使終端用戶無法訪問系統(tǒng)服務(wù);CPU或內(nèi)存的失效則會導(dǎo)致系統(tǒng)的死機;
2、應(yīng)用程序或操作系統(tǒng)出錯
由于操作系統(tǒng)或應(yīng)用程序中可能存在不完善的地方,當(dāng)碰到某種激發(fā)事件時,應(yīng)用程序非正常終止或系統(tǒng)崩潰;
3、人為錯誤
一些人工的誤操作,如刪除系統(tǒng)或應(yīng)用文件,終止系統(tǒng)或應(yīng)用服務(wù)進程,也會導(dǎo)致數(shù)據(jù)丟失或者系統(tǒng)服務(wù)的無法訪問;
4、電腦病毒/黑客入侵
由于目前的大多數(shù)計算機系統(tǒng)直接或通過U盤等硬件設(shè)備間接地連接在網(wǎng)絡(luò)上,若缺少有效的防范機制,很容易遭受病毒的感染或黑客的入侵,輕者數(shù)據(jù)被損壞,重者系統(tǒng)癱瘓;
5、自然災(zāi)害
由于一些意外的不可抗拒的因素,如雷擊、火災(zāi)、洪災(zāi)等導(dǎo)致的計算機系統(tǒng)破壞,將會使一般系統(tǒng)的恢復(fù)非常困難和耗時,導(dǎo)致業(yè)務(wù)系統(tǒng)長時間的中斷。
6、正常的停機
主要指計劃內(nèi)的系統(tǒng)升級、安裝軟件等過程。
三、相關(guān)領(lǐng)域國內(nèi)外技術(shù)現(xiàn)狀、發(fā)展趨勢及現(xiàn)有工作基礎(chǔ)
備份的歷史可以追溯到上世紀50年代,那時候國外一些公司就開始對自己的重要數(shù)據(jù)進行備份保護。但那時候重要數(shù)據(jù)以紙質(zhì)媒體為多,電子數(shù)據(jù)只有一小部分,他們將其副本放置在另一個相對安全的地點存放,防止災(zāi)難事故對數(shù)據(jù)的損壞,這便是容災(zāi)備份的雛形。
70年代的時候隨著電子數(shù)據(jù)越來越多,這種類似的數(shù)據(jù)容災(zāi)保護形式越來越普遍。到了80年代,美國市場上已經(jīng)有了上百個專業(yè)公司。一些視數(shù)據(jù)為生命且數(shù)據(jù)量巨大的金融公司開始廣泛的采用這些公司提供的異地災(zāi)備中心存儲解決方案。
1983年,政府開始對數(shù)據(jù)安全進行足夠的重視。美國聯(lián)邦貨幣監(jiān)管中心要求金融機構(gòu)起草了有關(guān)數(shù)據(jù)災(zāi)難備份及恢復(fù)的指導(dǎo)性文件,主要強調(diào)數(shù)據(jù)庫的備份和恢復(fù),通過運送備份磁帶到專門的存儲地實現(xiàn)安全。此文件一直使用到1989年,聯(lián)邦貨幣監(jiān)管中心有了更詳盡更成熟的一套數(shù)據(jù)安全相關(guān)資料
進入九十年代,計算機的迅速發(fā)展和普及在大大的提高了生產(chǎn)效率的基礎(chǔ)之上也給再災(zāi)難行業(yè)帶來了新的市場和機遇,更過容災(zāi)備份廠家和產(chǎn)品有了用武之地。
九十年代的中后期(2000年前后),出現(xiàn)了業(yè)務(wù)連續(xù)性的概念,并開始逐漸取代單純的災(zāi)難恢復(fù)。與災(zāi)難恢復(fù)相比,業(yè)務(wù)連續(xù)性不只局限于傳統(tǒng)的IT系統(tǒng),而是涵蓋了包括人為操作失誤、網(wǎng)絡(luò)故障、流程中斷等。
2000年以后,隨著國內(nèi)各行業(yè)信息系統(tǒng)的快速發(fā)展,特別是銀行、證券、保險和政府等行業(yè)業(yè)務(wù)大集中速度的加快,企業(yè)的技術(shù)風(fēng)險也相對集中。一旦發(fā)生災(zāi)難,則將導(dǎo)致政府和企業(yè)所有分支機構(gòu)、營業(yè)網(wǎng)點和全部的業(yè)務(wù)處理停頓,或造成企業(yè)客戶數(shù)據(jù)的丟失。如何防范技術(shù)風(fēng)險,確保數(shù)據(jù)安全和業(yè)務(wù)連續(xù)性,已成為企業(yè)急需面對的課題。
雖然國內(nèi)的信息化建設(shè)足足比國外晚了近五十年,但是一直是用一種飛向的速度在追趕。基于此國家相關(guān)部門借鑒國外的容災(zāi)備份理念,對加強信息安全保障工作十分重視,先后出臺了多項有關(guān)信息安全保障措施。如中國人民銀行于2002年8月下發(fā)了《關(guān)于加強銀行數(shù)據(jù)集中安全工作的指導(dǎo)意見》,指出:“為保障銀行業(yè)務(wù)的連續(xù)性,確保銀行穩(wěn)健運行,實施數(shù)據(jù)集中的銀行必須建立相應(yīng)的災(zāi)難備份中心。” “業(yè)務(wù)連續(xù)性計劃應(yīng)報中國人民銀行備案。”。
2003年8月,中辦發(fā)[2003]27號文件——《國家信息化領(lǐng)導(dǎo)小組關(guān)于加強信息安全保障工作的意見》規(guī)定:各基礎(chǔ)信息網(wǎng)絡(luò)和重要信息系統(tǒng)建設(shè)要充分考慮抗毀性與災(zāi)難恢復(fù),制定和不斷完善信息安全應(yīng)急處置預(yù)案。“誰主管誰負責(zé),誰運營誰負責(zé)”。
2004年9月,信安通(國家網(wǎng)絡(luò)與信息安全協(xié)調(diào)小組辦公室)發(fā)[2004]11號文件——《關(guān)于做好重要信息系統(tǒng) 災(zāi)難備份工作的通知》:提高抵御災(zāi)難和重大事故的能力,減少災(zāi)難打擊和重大事故造 成的損失、確保重要信息系統(tǒng)的數(shù)據(jù)安全和作業(yè)連續(xù)性,避免 引起社會重要服務(wù)功能的嚴重中斷,保障社會經(jīng)濟的穩(wěn)定,要求“統(tǒng)籌規(guī)劃、資源共享、平戰(zhàn)結(jié)合”!
同年2004年9月,開始起草《信息系統(tǒng)災(zāi)難恢復(fù)指南》初稿;
2004年10月22日,成立了由國信辦領(lǐng)導(dǎo)、8大重點行業(yè)和5個政府單位專家及 萬國數(shù)據(jù)服務(wù)公司組成的《指南》工作組;
2005年4月,國信辦以文件的形式下發(fā)了《信息系統(tǒng)災(zāi)難恢復(fù)指南》;
2006年5月,信安標(biāo)委專家討論,按照國家標(biāo)準(zhǔn)的要求調(diào)整《指南》的內(nèi)容,形成征求意見稿;
2006年6月20日,召開信息系統(tǒng)災(zāi)難恢復(fù)國家標(biāo)準(zhǔn)工作組會議。根據(jù)意見,《信息系統(tǒng)災(zāi)難恢復(fù)指南》更名為《信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范》;
2006年9月12日,信安標(biāo)委召開WG7工作組標(biāo)準(zhǔn)項目投票工作會議,一致通過 成員單位投票,經(jīng)過對《規(guī)范》的再次修改,形成《規(guī)范》的送審稿修改稿。
2007年7月30日,《信息安全技術(shù) 信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范》發(fā)布;2007年11 月1日實施,將災(zāi)難恢復(fù)能力分為七個等級,成為國標(biāo)。
由此可見,信息系統(tǒng)安全和災(zāi)難備份已經(jīng)引起了國家、社會、企業(yè)的高度重視,災(zāi)難備份業(yè)務(wù)的發(fā)展是客戶保持業(yè)務(wù)連續(xù)運作的需要,同時也是社會的需要和政策法規(guī)的要求,是市場發(fā)展的必然。
在這個大環(huán)境下,國外的廠商蜂擁而入。Veritas、CA、Falconstor(飛康)、Bakbone、Commvault這些軟件公司巨頭很快的占據(jù)了國內(nèi)容災(zāi)備份市場的半壁江山。而更早進入中國市場的硬件巨頭們,眼饞這塊大蛋糕,也很快的伸出刀叉,通過自主研發(fā)或者兼并收購等模式很快的擴充了自己的產(chǎn)品線,提供軟硬結(jié)合的產(chǎn)品,通過軟件為硬件增值,通過硬件為軟件鋪路。如IBM的TSM(Tivoli Storage Manager)系列;HP的DP(Data Protector)系列;EMC收購Legato以后推出的Network系列。這些99%來自美國的產(chǎn)品,很快的瓜分了國內(nèi)的容災(zāi)備份市場。如此這般,國內(nèi)數(shù)據(jù)安全的命脈竟幾乎全部掌握在了國外產(chǎn)品的手中,我們的使用者竟心安理得,殊不知這種潛在的威脅將是致命的。當(dāng)年美伊戰(zhàn)爭時,伊拉克從法國買的防空系統(tǒng)打印機都被美國植入了木馬芯片,以至于在后來的“沙漠行動”中,美國飛行員像在家里玩電子游戲一樣自由自在地來來去去。
歷史總會重演,如果我們不引起足夠的重視,下一個目標(biāo)可能就是我們。何況美國現(xiàn)在在抵制我國的華為、中興產(chǎn)品,認為這些產(chǎn)品威脅到了他們的信息安全,而我們卻還在瘋狂的購買iphone,肆無忌憚的使用國外的軟件來備份自己的核心數(shù)據(jù),這會讓我們一不小心就成了賣國賊。
也許有人會說,是因為國內(nèi)的軟件不爭氣,我們才使用國外的產(chǎn)品。但這只不過是一種推脫責(zé)任的借口。想我中華泱泱大國,民間高手無數(shù),且近幾年在核高基政策的支持和扶持下,軟件產(chǎn)品飛速發(fā)展,已經(jīng)產(chǎn)生了一大批的高新企業(yè)和優(yōu)秀軟件。榆林三院信息系統(tǒng)容災(zāi)備份現(xiàn)狀
我院信息系統(tǒng)建立在Windows 2008操作平臺上,現(xiàn)有兩臺臺服務(wù)器,其上運行了HIS、PACS等系統(tǒng)。這些服務(wù)器只作了單一的本地數(shù)據(jù)存儲,并在指定的時間通過數(shù)據(jù)命令將數(shù)據(jù)備份在另一臺PC機中。操作系統(tǒng)是Windows 2008R2 64bit,數(shù)據(jù)庫系統(tǒng)是Oracle。比如醫(yī)院HIS和PACS服務(wù)器每天晚上10:00通過ORACLE EXPORT將HIS數(shù)據(jù)導(dǎo)出成一個DMP文件。如果本地服務(wù)器出現(xiàn)硬件故障(CPU、LAN、POWER、FAN等),都將導(dǎo)致醫(yī)院部分日常業(yè)務(wù)中斷,對于依賴計算機管理水平高的醫(yī)院來說,很多的業(yè)務(wù)將無法開展。當(dāng)ORACLE數(shù)據(jù)庫出現(xiàn)故障時,對于時間要求嚴格、病人數(shù)據(jù)大的醫(yī)院出現(xiàn)短暫的停頓都無法忍受。如果采用上面所說將DMP文件也入回數(shù)據(jù)庫中,首先要修復(fù)硬件,重裝操作系統(tǒng),至少需要數(shù)個小時甚至幾天才能恢復(fù),并且要丟失好一天的業(yè)務(wù)數(shù)據(jù)。
四、項目計劃目標(biāo)及主要研究內(nèi)容
理想的容災(zāi)解決方案通常都具備以下內(nèi)容
第一、數(shù)據(jù)的實時備份。RPO(恢復(fù)到目標(biāo))=0,確保數(shù)據(jù)零丟失;
第二、數(shù)據(jù)持續(xù)回退,且保證回退點數(shù)據(jù)完整可用。以便找回誤刪除的數(shù)據(jù)及在數(shù)據(jù)不完整時能恢復(fù)數(shù)據(jù)到最近的完整狀態(tài);
第三、本異地容災(zāi)。將數(shù)據(jù)實時備份到同城以及異地機房,降低本地機房出現(xiàn)大的事故時候?qū)︶t(yī)院的損害。
第四、業(yè)務(wù)連續(xù)性管理。原系統(tǒng)不論什么原因出現(xiàn)故障停止對外服務(wù)時,備份系統(tǒng)可以在很短的時間接替原服務(wù)器對外提供服務(wù),讓系統(tǒng)恢復(fù)正常,即RTO(恢復(fù)時間目標(biāo))≈0,以免影響醫(yī)院信息系統(tǒng)業(yè)務(wù)。
根據(jù)對醫(yī)院環(huán)境和應(yīng)用特點的分析,我院通過整合存儲架構(gòu)、采用群集高可用系統(tǒng)、核心數(shù)據(jù)的集中備份和異地備份、系統(tǒng)容災(zāi)快速恢復(fù)等多種數(shù)據(jù)安全保護方式,完全消除上述隱患,并可做到系統(tǒng)平滑升級和在線擴容。
具體而言,我院的信息系統(tǒng)的主要需求在以下幾個方面:
1、高性能和高可靠的集中存儲系統(tǒng):由于有大量的并發(fā)訪問,需要對目前的單機存儲架構(gòu)進行改造,構(gòu)建一個高效安全的專用存儲網(wǎng)絡(luò),可以把我院的信息系統(tǒng)整合為FC SAN存儲架構(gòu)。存儲設(shè)備采用具備高性能和高可靠性的光纖接口的磁盤陣列,實現(xiàn)數(shù)據(jù)的集中存儲。磁盤采用高可靠的SAS磁盤或FC磁盤。
2、存儲和備份空間容量要求: 針對上述所有應(yīng)用系統(tǒng)的服務(wù)器實現(xiàn)集中存儲管理,考慮到3-5年的數(shù)據(jù)增長,集中存儲設(shè)備的容量要求達到:醫(yī)院需要3TB的存儲容量;集中備份需要至少5TB的可用空間。
3、數(shù)據(jù)的高安全性:由于HIS、PACS等數(shù)據(jù)是絕對不能丟失的核心業(yè)務(wù)數(shù)據(jù),因此需要對核心業(yè)務(wù)數(shù)據(jù)做冗余的在線和離線數(shù)據(jù)保護,構(gòu)建一個完整的數(shù)據(jù)統(tǒng)一備份系統(tǒng),將整個網(wǎng)絡(luò)中的所有關(guān)鍵數(shù)據(jù)庫數(shù)據(jù)進行集中備份,建立統(tǒng)一的備份策略,自動備份數(shù)據(jù)。針對上述的數(shù)據(jù)庫服務(wù)器的數(shù)據(jù)實現(xiàn)在線備份(包括對SQL、Oracle等主流數(shù)據(jù)庫的在線備份),數(shù)據(jù)集中備份到虛擬磁帶庫中,這樣在主存儲設(shè)備中的數(shù)據(jù)出現(xiàn)損壞或丟失的情況下都能夠迅速從虛擬帶庫中得以恢復(fù);另外,對于需要長期保存的數(shù)據(jù),可以通過備份到與虛擬磁帶庫直接連接的一臺物理磁帶庫中,實現(xiàn)離線的歸檔。整個數(shù)據(jù)的備份和恢復(fù),以至于將來可能的數(shù)據(jù)遷移、數(shù)據(jù)復(fù)制等一系列數(shù)據(jù)管理操作,都是通過備份軟件來統(tǒng)一管理。因此需要采用技術(shù)領(lǐng)先,具備圖形化操作、全中文管理界面,以及支持斷點續(xù)傳(尤其是數(shù)據(jù)庫的斷點續(xù)傳)和真正合成全備份的備份軟件。系統(tǒng)設(shè)計目標(biāo)
為上述應(yīng)用系統(tǒng)建設(shè)集中存儲和備份網(wǎng)絡(luò),以及異地的數(shù)據(jù)容災(zāi)中心,實現(xiàn)數(shù)據(jù)的統(tǒng)一安全管理,針對不同應(yīng)用類型和數(shù)據(jù)類型提供多重的數(shù)據(jù)安全保護
手段,在此基礎(chǔ)上確保核心應(yīng)用的7*24小時連續(xù)運行。
存儲系統(tǒng)建設(shè)目標(biāo):使用高性能、高可靠性的大容量存儲設(shè)備,進行存儲整合,通過建立FC SAN存儲基礎(chǔ)架構(gòu),使數(shù)據(jù)集中存儲,建立一個高效、穩(wěn)定、可靠的存儲網(wǎng)絡(luò)、數(shù)據(jù)存儲中心和安全的管理平臺。備份系統(tǒng)建設(shè)目標(biāo):構(gòu)建一個完整的企業(yè)級數(shù)據(jù)備份平臺。將整個存儲網(wǎng)絡(luò)中的重要數(shù)據(jù)進行集中備份,建立統(tǒng)一的備份策略,備份作業(yè)自動化,實現(xiàn)數(shù)據(jù)的在線備份和離線歸檔。在備份設(shè)備中使用高速的備份介質(zhì),減少日常備份/恢復(fù)作業(yè)對系統(tǒng)可用性及性能的影響,實現(xiàn)快速的備份/恢復(fù)機制。系統(tǒng)設(shè)計原則
1、存儲系統(tǒng)的設(shè)計原則
? 提高存儲空間利用率,節(jié)省總體數(shù)據(jù)存儲成本,有效提高投入產(chǎn)出比。
? 數(shù)據(jù)整合,進行統(tǒng)一的管理與應(yīng)用,降低管理員的工作量以及人力開支成本。? 磁盤陣列的讀寫速度與穩(wěn)定性要高。? 支持靈活安全的在線擴容。
? 采用多種RAID模式使設(shè)備更加可靠,保證有磁盤損壞時不影響數(shù)據(jù)。
? 專用的外置存儲設(shè)備支持控制器、電源、鋰電池、風(fēng)扇等關(guān)鍵部件的熱插拔,故障部件可以在線更換; ? 可以實現(xiàn)分級存儲功能;
備份系統(tǒng)的設(shè)計原則
? 可以采用專用的備份網(wǎng)絡(luò),避免業(yè)務(wù)系統(tǒng)網(wǎng)絡(luò)和備份網(wǎng)絡(luò)的互相干擾。
? 針對特別的應(yīng)用,可以提供零窗口和LAN-Free的備份方式。? 支持介質(zhì)復(fù)制的斷點續(xù)傳,減少網(wǎng)絡(luò)帶寬,提高網(wǎng)絡(luò)帶寬的利用率。
? 數(shù)據(jù)的備份采用D2D2T策略,通過在線的磁盤陣列,近線的虛擬磁帶庫,離線的物理磁帶庫,共同完成信息生命周期的數(shù)據(jù)安全基礎(chǔ)架構(gòu)。
集中存儲系統(tǒng)具體描述
對于醫(yī)院的數(shù)據(jù)中心,本方案將構(gòu)建一套FC SAN的存儲架構(gòu),將用戶的關(guān)鍵應(yīng)用系統(tǒng)數(shù)據(jù)(如: HIS服務(wù)器,PACS服務(wù)器)集中存儲在一臺光纖磁盤陣列(作為一級存儲設(shè)備)中,該磁盤陣列配置雙機頭,確保了存儲設(shè)備的高可靠性。磁盤陣列可以實現(xiàn)FC磁盤和SATA磁盤的混插,數(shù)據(jù)可以保存在高穩(wěn)定性的FC磁盤中,將來可以考慮上SATA磁盤,實現(xiàn)數(shù)據(jù)在一套設(shè)備內(nèi)的分級存儲。
在主機與存儲的連接鏈路上,接入SAN的所有主機,可以配置2塊HBA光纖適配卡,同時連接兩臺光纖交換機,確保任何一條光纖鏈路中斷均不會影響用戶的正常業(yè)務(wù)使用,完全消除了單點故障。統(tǒng)一的集中化存儲
在本次方案中,根據(jù)我院目前的存儲空間規(guī)劃,以及我院未來三至五年內(nèi)的需求,給我院配置3TB的存儲可用空間用于SAN的數(shù)據(jù)集中存儲,配置質(zhì)量和性能都比較好的FC硬盤來存放數(shù)據(jù)。同時,為防止磁盤陣列自身出現(xiàn)嚴重的物理故障導(dǎo)致數(shù)據(jù)丟失,還可以另外選配兩臺磁盤陣列,兩臺磁盤陣列之間通過卷復(fù)制功能來實現(xiàn)兩臺存儲設(shè)備之間的數(shù)據(jù)同步。
對于以后需要增加的其他應(yīng)用服務(wù)器,將來可以通過增加光纖HBA卡的方式,接入FC SAN。SAN存儲架構(gòu)
SAN存儲架構(gòu)具備良好的擴容性,未來可以方便地升級與維護。當(dāng)信息系統(tǒng)需要擴建時,只要把新的設(shè)備,接入到SAN架構(gòu)中,便可以使用集中存儲提供資源,所以,SAN架構(gòu),可以作為一個基礎(chǔ)的設(shè)施來建設(shè),它可以充分地保護投入的成本,為日后系統(tǒng)的擴容,升級打下了良好的基礎(chǔ)。SAN存儲架構(gòu)的特性:
1.可實現(xiàn)大容量存儲設(shè)備數(shù)據(jù)的共享。
2.可實現(xiàn)高速計算機與高速存儲設(shè)備的高速互聯(lián)。3.可實現(xiàn)靈活的存儲設(shè)備配置要求。4.可兼容以前的存儲設(shè)備。5.提高了數(shù)據(jù)的可靠性和安全性。6.避免了數(shù)據(jù)的“信息孤島”效應(yīng)。數(shù)據(jù)備份與恢復(fù)的跨平臺性和可靠性
現(xiàn)在的備份軟件已經(jīng)比較成熟,如CommVault,Symantec,NetStor Backup Express等等
數(shù)據(jù)備份恢復(fù)軟件的跨平臺性表現(xiàn)在:
? 能把備份UNIX文件恢復(fù)到不同版本的UNIX系統(tǒng);
? 能把UNIX的備份文件恢復(fù)到Windows、FreeBSD、HP-UX、IRIX、Linux、Solaris、Tru64操作系統(tǒng)上。
? 能把備份文件恢復(fù)到不同版本的Windows系統(tǒng),即在NT、2000、XP、2003之間實現(xiàn)跨版本恢復(fù)。
? 能把Windows的備份文件恢復(fù)到SOLARIS、FreeBSD、HP-UX、IRIX、Linux、Solaris、Tru64異構(gòu)平臺的操作系統(tǒng)上。數(shù)據(jù)備份恢復(fù)軟件的可靠性表現(xiàn)在:
?? 能實現(xiàn)備份、恢復(fù)及備份數(shù)據(jù)轉(zhuǎn)存的中斷再繼續(xù)(斷點續(xù)傳功能)。? 能對Oracle進行斷點續(xù)傳備份,確保備份成功率。
? 支持并發(fā)數(shù)據(jù)流,加速備份過程,充分利用多磁帶驅(qū)動器的磁帶庫設(shè)備。
? 能對增量備份、差量備份實現(xiàn)智能的、快速的“一次過”恢復(fù),確保一次性讀入要恢復(fù)數(shù)據(jù)的最新版本,極大提高恢復(fù)效率
本方案采用現(xiàn)在最先進的FC-SAN架構(gòu),實現(xiàn)了高速計算機與高速存儲設(shè)備的高速互聯(lián),實現(xiàn)了信息的集中存儲,避免了信息孤島的形成,同時,為以后醫(yī)院信息化的建設(shè)打下了基礎(chǔ)。
完整的備份系統(tǒng),可以保證數(shù)據(jù)的最大安全性,從數(shù)據(jù)的產(chǎn)生,數(shù)據(jù)的備份,到長久數(shù)據(jù)的歸檔,D2D分級存儲架構(gòu)完成了一個信息的生命周期。同時,數(shù)據(jù)實現(xiàn)自動備份,減少人工參與,降低醫(yī)院的管理成本,有效地保障了醫(yī)院數(shù)據(jù)的安全
五、技術(shù)、經(jīng)濟效益、市場風(fēng)險分析
在現(xiàn)代醫(yī)院越來越依賴計算機來對醫(yī)院的業(yè)務(wù)的開展和管理的今天,數(shù)據(jù)的安全無疑是重中之重,而數(shù)據(jù)的安全又是建立在存儲系統(tǒng)的基礎(chǔ)上,所以,一個架構(gòu)完整、合理、科學(xué)的存儲系統(tǒng),是實現(xiàn)現(xiàn)代醫(yī)院信息化過程中必須走的重要的一步。
高效的容災(zāi)備份系統(tǒng)和主-備服務(wù)器的快速切換模式可應(yīng)用于所有類型數(shù)據(jù)備份系統(tǒng),有效提高數(shù)據(jù)服務(wù)器的工作效率,大大降低數(shù)據(jù)信息丟失的風(fēng)險成本。全自動化模式提高了備份系統(tǒng)的穩(wěn)定性,同時降低了醫(yī)院管理成本。
六、申請單位簡況
榆林市第三醫(yī)院是市委、市政府批準(zhǔn)成立的一所綜合性、非營利性公立醫(yī)院。醫(yī)院位于東沙城區(qū)金陽小區(qū)旁邊,環(huán)境優(yōu)美、交通便利、設(shè)備先進、功能齊全、技術(shù)力量雄厚、服務(wù)熱情周到,是充分體現(xiàn)“以人為本”的綜合醫(yī)療服務(wù)機構(gòu)。
醫(yī)院現(xiàn)開放床位302張,設(shè)置有綜合內(nèi)科、綜合外科、骨科、婦產(chǎn)科、兒科、手術(shù)麻醉科、急診科、康復(fù)理療科、中醫(yī)科、皮膚科、眼科、口腔科、耳鼻喉科、感染科等14個臨床科室;影像科、檢驗輸血科、藥械科、功能科(B超室)、病理科、心電圖室、腦電圖室、消毒供應(yīng)室、內(nèi)鏡室、門診部等10個醫(yī)技科室。現(xiàn)有干部職工280人,其中專業(yè)技術(shù)人員243人,特聘專家13人,副高以上26人,中級35人,本科78人;行政及后勤管理人員37人。
擁有全進口美國GE16排螺旋CT機、美國GE DR、美國GE數(shù)字胃腸機、腹腔鏡、富士激光相機、西門子全自動生化分析儀、血液分析儀、飛利浦高端彩色B超機、德國進口高端呼吸機、麻醉機等大型醫(yī)療設(shè)備。
醫(yī)院始終堅持貫徹執(zhí)行黨的衛(wèi)生方針、政策,堅持“看病明白、檢查準(zhǔn)確、合理用藥、花錢清楚、一切為了患者”的服務(wù)理念,著力打造特色服務(wù)品牌,不斷提升診療技術(shù)水平。我們以精湛的技術(shù)、創(chuàng)新的理念、全新的面貌,竭誠為患者提供安全、高效、便捷、嚴謹?shù)尼t(yī)療服務(wù),今天的榆林三院將以新起點、高標(biāo)準(zhǔn)、跨越式的發(fā)展創(chuàng)造輝煌的業(yè)績,為人類健康事業(yè)的發(fā)展而努力奮斗!該項目由榆林市第三醫(yī)院信息科負責(zé)實施。
七、必要的支撐條件、組織措施及實施步驟
暫定項目預(yù)計于2015年11月至2016年2月之間完成項目所需的網(wǎng)絡(luò)環(huán)境與硬件設(shè)備及項目實施場地的建設(shè)。于2016年2月至2016年5月之間完成項目的關(guān)鍵技術(shù),達到項目技術(shù)指標(biāo);同時完成項目實施內(nèi)容記錄與所有相關(guān)技術(shù)問題的擴展總結(jié)
八、計劃實施進展、預(yù)算及來源渠道
項目總投資19萬,擬申請政府補助10萬,單位自籌9萬。其中硬件采購17萬,項目實施費用2萬
詳細配置參數(shù)列表
序號 采購內(nèi)容
HBA卡
技術(shù)規(guī)格或性數(shù)量
能指標(biāo) ★HBA卡:每臺配4個 套HBA卡:2個,光纖線3M LC-LC2條 ★售后服務(wù):提供原廠3年保修服務(wù),中標(biāo)方須在簽訂合同前提供原廠商服務(wù)承
報價
12000
諾函 備份服務(wù)器(X3650M4)
CPU:E5-2603 1臺 @1.80GHZ
1.80GHZ(2處理器)
內(nèi)存:8GB 網(wǎng)卡:Intel I350 Gigabit Network
Connection(4塊)
硬盤:2TB SATA(3塊)★HBA卡:每臺配套HBA卡:2個,光纖線3M LC-LC2條 可管理和維護性:光通路診斷,集成IMM(可選的Virtual Media Key支持Remote Presence)系統(tǒng)
支持的操作系統(tǒng):MS Windows Server 2008、Red Hat Linux 和 SUSE
Linux、Vmware ESX Server、標(biāo)配windows2008 服務(wù)
★售后服務(wù):提供原廠3年保修服務(wù),中標(biāo)方須在簽訂合同前提供原廠商服務(wù)承諾函
35000 3 磁盤陣列(DS3500)
★品牌:與服務(wù)1臺 器同品牌產(chǎn)品 控制器:配雙控制器,4個6Gbps SAS主機接口,Cache具備斷電保持數(shù)據(jù)完整功能。
支持SAN:支持SAN光纖通道交換機、支持1GBps/2GBps/4GBps
★主機接口:≥8個,8Gbps FC 主機端口
★數(shù)據(jù)Cache:每個控制器≥1G ★存儲容量:本次硬盤配置數(shù)量≥10塊,300G以上 3.5" SAS 15k rpm 最大驅(qū)動器數(shù)量:≥96個 圖形化管理軟件:配置圖形化管理軟件 多通路容錯及動態(tài)負載均衡功能:支持 安全訪問控制:防止LUN被未授權(quán)主機訪問。支持Cache分區(qū)技術(shù):支持 快照:支持 支持的操作系統(tǒng):Microsoft Windows 2003, Sun Solaris, IBM AIX, Linux, Novell Netware。
99000
高可用性:完全的硬件冗余:處理器、電源、風(fēng)扇、適配卡等都提供冗余,并保證在某硬件出現(xiàn)問題,能夠進行自動切換,不出現(xiàn)單點故障。4 5 備份軟件(Symantec Backup Exec Leo 11D Win)系統(tǒng)集成 要求 ★服務(wù)要求:提供3年7×24小時原廠上門保修維護
Back Exec沿襲最初在賽門鐵克Veritas NetBackup中使
用的針對虛擬環(huán)境的獲獎技術(shù),通過單一管理控制臺為VMware Infrastructure、Microsoft Windows Server 2008 Hyper-V以及傳統(tǒng)的物理系統(tǒng)提供全面的數(shù)據(jù)保護,同時降低成本,并提高多重虛擬和物理系統(tǒng)的管理。
工作內(nèi)容
1、說明:數(shù)據(jù)文
件大小在20G左右進行平滑遷移。★
2、進行數(shù)據(jù)模擬遷移(根據(jù)設(shè)計的數(shù)據(jù)遷移方案,建立一個模擬的數(shù)據(jù)遷移環(huán)境,它既能仿真實際環(huán)境又不影響實際數(shù)據(jù),然
套30000
硬件總價*10% 1 后在數(shù)據(jù)模擬遷移環(huán)境中測試數(shù)據(jù)遷移的效果。數(shù)據(jù)模擬遷移前也應(yīng)按備份策略備份模擬數(shù)據(jù),以便數(shù)據(jù)遷移后能按恢復(fù)策略進行恢復(fù)測試)
3、測試數(shù)據(jù)模擬遷移(根據(jù)設(shè)計的數(shù)據(jù)遷移測試方案測試數(shù)據(jù)模擬遷移,也就是檢查數(shù)據(jù)模擬遷移后數(shù)據(jù)和應(yīng)用軟件是否正常,主要包括:數(shù)據(jù)一致性測試、應(yīng)用軟件執(zhí)行功能測試、性能測試、數(shù)據(jù)備份和恢復(fù)測試等)
4、準(zhǔn)備實施數(shù)據(jù)遷移(數(shù)據(jù)模擬遷移測試成功后,在正式實施數(shù)據(jù)遷移前還需要做好以下幾個方面工作:進行完全數(shù)據(jù)備份、確定數(shù)據(jù)遷移方案、安裝和配置軟硬件、制定應(yīng)急方案等)
5、正式實施數(shù)據(jù)遷移(按照確定的數(shù)據(jù)遷移方案,正式實施數(shù)據(jù)遷移)測試數(shù)據(jù)遷移效果(按照數(shù)據(jù)遷移測試方案測試數(shù)據(jù)遷移效果,并對數(shù)據(jù)遷移后的數(shù)據(jù)庫參數(shù)和性能進行調(diào)整,使之滿足數(shù)據(jù)遷移后實際應(yīng)用系統(tǒng)的需要)
6、移植系統(tǒng)應(yīng)用軟件(將實際應(yīng)用系統(tǒng)的應(yīng)用軟件移植到數(shù)據(jù)遷移后的數(shù)據(jù)庫系統(tǒng)上,并使之正常運行)
7、正式運行應(yīng)用系統(tǒng)(在正式實施數(shù)據(jù)遷移成功并且數(shù)據(jù)庫參數(shù)和性能達到要求后,就可以正式運行應(yīng)用系統(tǒng),并投入實際使用)
8、數(shù)據(jù)庫升級到Windows+Oracle 11g。
9、數(shù)據(jù)庫遷移時間控制在2~3小時內(nèi),不能超過4小時,須提供詳細的升級、遷移方案。
10、數(shù)據(jù)庫遷移時能繼續(xù)支持醫(yī)院業(yè)務(wù)的正常運行,包括門診業(yè)務(wù)(如門急診收費、門診藥房、門診診間、皮試系統(tǒng)等),及重要的住院業(yè)務(wù)(如住院收費、醫(yī)囑等),須提供詳細方案來滿足遷移要求。
第四篇:容災(zāi)備份解決方案
2010-8-11 容災(zāi)備份系統(tǒng)簡介
一、項目背景
隨著計算機技術(shù)的快速發(fā)展,每個企業(yè)都在大量的使用計算機處理自己的核心數(shù)據(jù),這些數(shù)據(jù)往往是企業(yè)生產(chǎn)經(jīng)營必不可少的部分。依賴這些數(shù)據(jù)的計算機系統(tǒng)的停機往往會造成企業(yè)生產(chǎn)經(jīng)營活動的停頓,給企業(yè)造成巨大的損失。所以,可以說,這些數(shù)據(jù)是企業(yè)的生命核心。企業(yè)的IT管理員為了保證生產(chǎn)經(jīng)營活動的持續(xù)運行,不斷的加強對系統(tǒng)和數(shù)據(jù)的保護,如使用基于雙機的高可用技術(shù),磁盤陣列系統(tǒng)的RAID技術(shù)等。然而,人們依然無法回避由于磁盤故障,人為失誤,應(yīng)用程序的邏輯錯誤,自然災(zāi)害等原因帶來的系統(tǒng)停機或者數(shù)據(jù)丟失。所以,數(shù)據(jù)備份作為數(shù)據(jù)保護的最后一道屏障,必不可少。
二、功能介紹
實時保護:連續(xù)捕獲、實時備份數(shù)據(jù)變化,全過程保護數(shù)據(jù)安全。實現(xiàn)真正的持續(xù)性數(shù)據(jù)保護(CDP),無需設(shè)置任何備份時間點,居國內(nèi)外同類產(chǎn)品領(lǐng)先地位。
完善備份:同一軟件可實現(xiàn)“數(shù)據(jù)庫雙機熱備+接管”、“本地實時災(zāi)備”、“異地實時災(zāi)備”,全方位保證數(shù)據(jù)庫安全。
任意回退:可按任意操作步數(shù)或時間點進行數(shù)據(jù)回退。主數(shù)據(jù)庫遭到破壞時,備份數(shù)據(jù)庫可將主數(shù)據(jù)庫回退到損壞前最后時刻的狀態(tài),且能保證事件的完整性。快速恢復(fù):主數(shù)據(jù)庫或表損壞,從站自動檢測,提示回退的步數(shù)。恢復(fù)1個G數(shù)據(jù)庫在3-5分鐘。
增量備份:只備份變化部分,在保障備份數(shù)據(jù)安全的同時減少備份的工作量。
錯峰機制: 在系統(tǒng)負荷極大時暫停備份以免系統(tǒng)癱瘓,當(dāng)系統(tǒng)負荷下降時備份暫停期間的數(shù)據(jù),并重新開始實時備份。
低耗資源:對主數(shù)據(jù)庫壓力小,系統(tǒng)采用消息機制,只有災(zāi)數(shù)據(jù)庫發(fā)生變化時才觸發(fā),只傳數(shù)據(jù)庫的變化部分,不同于文件拷貝,和數(shù)據(jù)表的輪詢。
操作簡單:自主開發(fā)設(shè)計,著重考慮國內(nèi)用戶使用習(xí)慣,安裝、設(shè)置非常簡單。
維護方便:啟動或連接中斷后重連時,自動校驗主從站數(shù)據(jù),保證數(shù)據(jù)準(zhǔn)確。
加密傳輸:底層通訊采用自主研發(fā)的通訊平臺,所有數(shù)據(jù)都是用加密數(shù)據(jù)包進行數(shù)據(jù)交換,充分保證數(shù)據(jù)安全。
高性價比:在各項性能領(lǐng)先的同時,價格遠遠優(yōu)于國外軟件。當(dāng)選擇不接管的熱容災(zāi)備份方式時,從站可采用低檔Server或高穩(wěn)定性的PC(有足夠的存儲空間即 2
可),從而實現(xiàn)極低的總體成本。
通用性好:不對數(shù)據(jù)庫中的應(yīng)用做任何修改。與數(shù)據(jù)庫中表的結(jié)構(gòu)無關(guān),且無任何限制。對數(shù)據(jù)庫備份完整:如TABLES(表)、DIAGRAMS(關(guān)系圖)、VIEWS(視圖)、USERS(用戶)、ROLES、RULES等。
三、解決方案優(yōu)點
能夠?qū)崿F(xiàn)雙數(shù)據(jù)庫的實時同步,能夠保證雙份數(shù)據(jù)庫的實時一致性,如果主生產(chǎn)數(shù)據(jù)庫失敗,備數(shù)據(jù)庫庫服務(wù)器隨時可啟用為主數(shù)據(jù)庫服務(wù)器。不再需要介質(zhì)恢復(fù)的過程。
多節(jié)點存儲冗余體系
熱備方案要求最少有雙份數(shù)據(jù)庫,不但心生產(chǎn)數(shù)據(jù)庫崩潰,磁盤硬件崩潰,而造成數(shù)據(jù)庫不可用問題.多份數(shù)據(jù)源才是真正的冗余體系,真正消除了數(shù)據(jù)庫系統(tǒng)管理人員為存儲單點故障的后顧之憂!不存在物理介質(zhì)恢復(fù)時間問題
因為雙數(shù)據(jù)庫的實時同步,保證雙份數(shù)據(jù)庫的一致性,如果主生產(chǎn)數(shù)據(jù)庫失敗,備數(shù)據(jù)庫庫服務(wù)器隨時可啟用為主數(shù)據(jù)庫服務(wù)器.不存在介質(zhì)恢復(fù)時間.這與雙機熱備比較,完全消除掉備份恢復(fù)這一個過程。
同步時間完全實時
主數(shù)據(jù)庫與從數(shù)據(jù)庫可以做到實時同步,消除了備份軟件中的間隔備份丟失數(shù)問題.同時提供了完全不丟失數(shù)據(jù)模式和丟失秒內(nèi)業(yè)務(wù)數(shù)據(jù)校正方式。
解決了數(shù)據(jù)誤刪除恢復(fù)問題
與HA,CDP軟件比較,當(dāng)數(shù)據(jù)庫管理人員遇到意外誤刪除求助,熱備系統(tǒng)可以提供事務(wù)級別的按步數(shù)或者時間點的回退動作,確定記錄,恢復(fù)記錄.不需要像傳統(tǒng)備份軟件為了一個記錄而恢復(fù)整個數(shù)據(jù)庫。
數(shù)據(jù)庫異地容災(zāi)問題
完全支持異地數(shù)據(jù)同步,支持斷點續(xù)傳,數(shù)據(jù)一致性校驗。
四、解決方案
(一)1、備份方案
(一)示意圖:容災(zāi)標(biāo)準(zhǔn)版(一主一從)
備份方案:
說明:
1:在1號Server系統(tǒng)中安裝,設(shè)置成主站。2:在2號Server上安裝,設(shè)置成從站
3:正常運行后,2號Server能夠?qū)崟r備份1號Serve中的數(shù)據(jù)庫的數(shù)據(jù) 4:在1號Server宕機的情況下,2號Serve能接管主服務(wù)器的IP和機器名,對外提供所有的服務(wù),保證業(yè)務(wù)不間斷
5:當(dāng)1號Server修復(fù)后,能快速將2號Server上數(shù)據(jù)恢復(fù)到1號Server中。
能實現(xiàn)的效果及主要功能:
1)將主服務(wù)器上的數(shù)據(jù)實時智能的備份到從站備份服務(wù)器里
2)如果數(shù)據(jù)庫遭到病毒破壞或者誤刪除可用數(shù)據(jù)回退進行解決;回復(fù)的任意時間點的數(shù)據(jù)
3)主站宕機或者磁盤柜損壞,備份服務(wù)器可接管主站服務(wù)器對外服務(wù),保證客戶端的正常運行
2、備份方案
(二)示意圖:容災(zāi)(一主兩從)版本
S2備份服務(wù)器S1主數(shù)據(jù)庫服務(wù)器 終端 S3備份服務(wù)器辦公樓 XX樓
說明:
1)2)3)4)主站服務(wù)器(S1)安裝標(biāo)準(zhǔn)版軟件設(shè)置成主站;
從站備份服務(wù)器(S2)安裝標(biāo)準(zhǔn)版軟件設(shè)置成從站1,作為備份服務(wù)器1; 從站備份服務(wù)器(S3)安裝M標(biāo)準(zhǔn)版軟件設(shè)置成從站2,作為備份服務(wù)器2; 正常運行后,從S1能夠同時實時備份主站或磁盤柜中的數(shù)據(jù)庫數(shù)據(jù)到S2、S3;
能實現(xiàn)的效果及主要功能: 5)在S1或磁盤柜損壞的情況下,S2能接管S1對外提供服務(wù),保證客戶端的正常運行,當(dāng)S2亦出現(xiàn)意外事故時,S3能接管S2對外提供服務(wù),保證客戶端的正常運行;
6)當(dāng)主機房損壞設(shè)備完全修復(fù)后,能快速將S2或者S3上數(shù)據(jù)恢復(fù)到S1存儲中。3)將數(shù)據(jù)中心的SQL數(shù)據(jù)庫中的數(shù)據(jù)實時的備份到從站服務(wù)器中; 4)如果數(shù)據(jù)庫遭到病毒破壞或者誤刪除可用數(shù)據(jù)回退進行解決; 5)如果主站宕機或者磁盤柜損壞,備份服務(wù)器可接管主站服務(wù)器對外服務(wù),保證客戶端的正常運行。
3.方案
(三)方案示意圖:集群版(兩主一叢)
針對雙機磁盤柜的異地容災(zāi):
主數(shù)據(jù)服務(wù)器雙機環(huán)境 磁盤柜 終端 雙機 集群 備份服務(wù)器1號2號 實時備份 數(shù)據(jù)回退 接管 異地容災(zāi) 3號server
說明:
1、在1、2號server組成的集群系統(tǒng)中安裝 FOR CLUSTER版設(shè)置成主站;
2、在3號server上安裝 FOR CLUSTER版設(shè)置成從站;
3、正常運行后,3號server能夠?qū)崟r備份集群磁盤柜中的數(shù)據(jù)庫數(shù)據(jù);
4、在集群中的1、2號機器同時宕機或磁盤柜損壞的情況下,3號server能接管集群對外提供服務(wù),保證客戶端的正常運行;
5、當(dāng)主數(shù)據(jù)服務(wù)器被損壞設(shè)備修復(fù)后,能快速將3號server上數(shù)據(jù)恢復(fù)到集群存儲中。
能實現(xiàn)的效果及主要功能:
1)避免了雙機集群的磁盤柜的單點故障,有雙份數(shù)據(jù)安全。2)數(shù)據(jù)庫遭到病毒破壞或者誤刪除可用數(shù)據(jù)回退進行解決;
3)主站同時或者磁盤柜損壞,備份服務(wù)器可接管主站服務(wù)器對外服務(wù),保證客戶端的正常運行。
4.方案
(四)方案示意圖:集中備份(多對一)
數(shù)據(jù)服務(wù)器 業(yè)務(wù)數(shù)據(jù) 辦公server備份中心 辦公數(shù)據(jù) 業(yè)務(wù)server1號2號財務(wù)server實時熱備接管回退管理server異地備份集中備份XX server 管理數(shù)據(jù) 3號X號 XX數(shù)據(jù)
說明:
1、在各個主數(shù)據(jù)服務(wù)器系統(tǒng)中安裝,設(shè)置成主站;
2、在備份中心的備份服務(wù)器上安裝,設(shè)置成從站;
3、正常運行后,備份中心能實時備份數(shù)據(jù)服務(wù)器的數(shù)據(jù)庫數(shù)據(jù);
4.任一主服務(wù)器的數(shù)據(jù)丟失后,都可以從備份服務(wù)器迅速的給主服務(wù)器恢復(fù)數(shù)據(jù)。
能實現(xiàn)的效果及主要功能:
1.可以把各個業(yè)務(wù)服務(wù)器數(shù)據(jù)庫的數(shù)據(jù)實時智能的備份到數(shù)據(jù)中心的服務(wù)器里,當(dāng)任何一個主業(yè)務(wù)服務(wù)器的數(shù)據(jù)丟失時,都可以從數(shù)據(jù)中心的服務(wù)器里進行快速的恢復(fù)。
5.方案
(五)方案示意圖:集中備份(本地做一對一,異地做多對一)
說明:
1:在各主服務(wù)器SERVER 1-N中安裝設(shè)置成主站,在SERVER1’ –SERVERN’中安裝設(shè)置從站,主從站通過數(shù)據(jù)庫保鏢進行實時備份,當(dāng)本SERVER 1-N出現(xiàn)問題后,對應(yīng)的SERVER1’ –SERVERN’可以進行接管或恢復(fù)。
2:SERVER作為集中備份服務(wù)器,將SERVER 1-N中的數(shù)據(jù)實時集中備份到SERVER內(nèi),即使本地數(shù)據(jù)丟失,也可以從數(shù)據(jù)中心取回。
能實現(xiàn)的效果及主要功能:
1.可以實現(xiàn)本地的數(shù)據(jù)實時備份和接管,當(dāng)主服務(wù)器出現(xiàn)宕機時,可以迅速的用備份服務(wù)器接管主機提供對外的服務(wù),保證業(yè)務(wù)不間斷。
2.當(dāng)主服務(wù)器本地出現(xiàn)意外災(zāi)難,數(shù)據(jù)全部丟失后,可以通過遠程的中心服務(wù)器恢復(fù)數(shù)據(jù),保證了數(shù)據(jù)的安全。
五、容災(zāi)容災(zāi)備份系統(tǒng)能實現(xiàn)的效果和功能
1.能實現(xiàn)對主服務(wù)器上的數(shù)據(jù)庫里的數(shù)據(jù)進行實時智能的備份,保證了數(shù)據(jù)的安全,一旦出現(xiàn)數(shù)據(jù)丟失或破壞,可以迅速的從備份機上把數(shù)據(jù)恢復(fù)回來。第一次做個全備份,把數(shù)據(jù)全部備份到備份機上,以后每次只做增量備份,把變化的數(shù)據(jù)做實時的備份,節(jié)省了備份空間,提高了備份效率。在備份時對服務(wù)器的性能沒有影響。
2.當(dāng)主服務(wù)器出現(xiàn)意外宕機時,備份機可以立刻接管主服務(wù)器的IP,提供對外的所有服務(wù),保證了核心業(yè)務(wù)連續(xù)性,可以提供365天7*24小時的業(yè)務(wù)不間斷的保護。
3.整個備份系統(tǒng)具有高容災(zāi)性和可擴展性,以后隨著數(shù)據(jù)量的增加也可以增加磁盤陣列等。
4.可以做到異地備份,真正的做到了有備無患。
第五篇:數(shù)據(jù)中心容災(zāi)備份方案
數(shù)據(jù)保護系統(tǒng)
醫(yī)院備份、容災(zāi)及歸檔數(shù)據(jù)容災(zāi)
解決方案
1、前言
在醫(yī)院信息化建設(shè)中,HIS、PACS、RIS、LIS 等臨床信息系統(tǒng)得到廣泛應(yīng)用。醫(yī)院信息化 HIS、LIS 和 PACS 等系統(tǒng)是目前各個醫(yī)院的核心業(yè)務(wù)系統(tǒng),承擔(dān)了病人診療信息、行政管理信息、檢驗信息的錄入、查詢及監(jiān)控等工作,任何的系統(tǒng)停機或數(shù)據(jù)丟失輕則降低患者的滿意度、醫(yī)院的信譽丟失,重則引起醫(yī)患糾紛、法律問題或社會問題。為了保證各業(yè)務(wù)系統(tǒng)的高可用性,必須針對核心系統(tǒng)建立數(shù)據(jù)安全保護,做到“不停、不丟、可追查”,以確保核心業(yè)務(wù)系統(tǒng)得到全面保護。
隨著電子病歷新規(guī)在 4 月 1 日的正式施行,《電子病歷應(yīng)用管理規(guī)范(試行)》要求電子病歷的書寫、存儲、使用和封存等均需按相關(guān)規(guī)定進行,根據(jù)規(guī)范,門(急)診電子病歷由醫(yī)療機構(gòu)保管的,保存時間自患者最后一次就診之日起不少于 15 年;住院電子病歷保存時間自患者最后一次出院之日起不少于 30 年。
2、醫(yī)院備份、容災(zāi)及歸檔解決方案
針對醫(yī)療衛(wèi)生行業(yè)的特點和醫(yī)院信息化建設(shè)中的主要應(yīng)用,包括:HIS、PACS、RIS、LIS 等,本公司推出基于數(shù)據(jù)保護系統(tǒng)的多種解決方案,以達到對醫(yī)院信息化系統(tǒng)提供全面的保護以及核心應(yīng)用系統(tǒng)的異地備份容災(zāi)
2.1 數(shù)據(jù)備份解決方案
針對于醫(yī)院的 HIS、PACS、LIS 等服務(wù)器進行數(shù)據(jù)備份時,數(shù)據(jù)保護系統(tǒng)的備份架構(gòu)采用三層構(gòu)架。
備份軟件主控層(內(nèi)置一體機):負責(zé)管理制定全域內(nèi)的備份策略和跟蹤客戶端的備份,能夠管理磁盤空間和磁帶庫庫及光盤庫,實現(xiàn)多個客戶端的數(shù)據(jù)備份。備份軟件主服務(wù)器是備份域內(nèi)集中管理的核心。
客戶端層(數(shù)據(jù)庫和操作系統(tǒng)客戶端):其他應(yīng)用服務(wù)器和數(shù)據(jù)庫服務(wù)器安裝備份軟件 標(biāo)準(zhǔn)客戶端,通過這個客戶端完成每臺服務(wù)器的 LAN 或 LAN-FREE 備份工作。另外,為包含數(shù)據(jù)庫的客戶端安裝數(shù)據(jù)庫代理程序,從而保證數(shù)據(jù)庫的在線熱備份。備份介質(zhì)層(內(nèi)置虛擬帶庫):主流備份介質(zhì)有備份存儲或虛擬帶庫等磁盤介質(zhì)、物理磁帶庫等,一般建議將備份存儲或虛擬帶庫等磁盤介質(zhì)作為一級備份介質(zhì),用于近期的備份數(shù)據(jù)存放,將物理磁帶庫或者光盤庫作為二級備份介質(zhì),用于長期的備份數(shù)據(jù)存放。
2.2 應(yīng)用級容災(zāi)解決方案
實時保護,可實現(xiàn)對醫(yī)院信息系統(tǒng)中核心業(yè)務(wù)系統(tǒng)的持續(xù)數(shù)據(jù)保護。在核心業(yè)務(wù)系統(tǒng)應(yīng)用數(shù)據(jù)寫入被保護服務(wù)器自身存儲的同時,寫入存儲設(shè)備中,顆粒度到秒級,最佳情況下可實現(xiàn)零數(shù)據(jù)丟失,通過鏡像功能保證連接的磁盤陣列中的數(shù)據(jù)與被保護的數(shù)據(jù)完全一致。同時,利用截獲每個寫I/O 功能并進行記錄,并且可基于時間點的快照進行回滾,此功能能夠在被保護服務(wù)器發(fā)生邏輯錯誤時,快速有效地進行每 I/O 節(jié)點或快照點的掛載,避免邏輯錯誤造成的數(shù)據(jù)損壞。當(dāng)存儲系統(tǒng)宕機等災(zāi)難發(fā)生時,采用快速掛載功能,可以最快在分鐘級別內(nèi)迅速恢復(fù)前端應(yīng)用或數(shù)據(jù)庫服數(shù)據(jù)功能,保證業(yè)務(wù)的連續(xù)性。
分流器:截取主機寫操作(塊級別), 主機每次對被保護磁盤的寫操作均被鏡像寫入到鏡像數(shù)據(jù)寫入過程在主機的主存儲讀寫路徑之外。
數(shù)據(jù)卷:保存主機分流器寫入的所有數(shù)據(jù)。
記錄卷和一致性代理:保存主機分流器寫入的 I/O 記錄根據(jù)應(yīng)用特點 , 通過技術(shù)中的一致性代理實現(xiàn)對 ORACLE、MS SQL 等數(shù)據(jù)庫在保存應(yīng)用數(shù)據(jù)一致性快照使數(shù)據(jù)能夠快速恢復(fù)到任意 I/O 記錄。2.3數(shù)據(jù)系統(tǒng)長期歸檔解決方案
可通過高級備份功能,把電子病歷、PACS 影像等數(shù)據(jù)備份到內(nèi)置空間后,歸檔一份到光存儲中,通過光存儲的可長期保留特性,實現(xiàn)數(shù)據(jù)的長期保留(最長可到 100 年以上),滿足法規(guī)要求。
2.4數(shù)據(jù)系統(tǒng)容災(zāi)解決方案
數(shù)據(jù)保護系統(tǒng)內(nèi)置災(zāi)備功能,可實現(xiàn)數(shù)據(jù)及應(yīng)用級別的容災(zāi),可支持一對一,多對一等多種拓樸架構(gòu),系統(tǒng)可互為源端及目標(biāo)端,完成異地備份、恢復(fù)功能。
1)數(shù)據(jù)級容災(zāi):
備份數(shù)據(jù)保存在設(shè)備中,各備份點的數(shù)據(jù)可獨立管理,可實現(xiàn)異機恢復(fù),提高數(shù)據(jù)的安全性。
2)應(yīng)用級容災(zāi):
數(shù)據(jù)保護系統(tǒng)的 CDP 功能把數(shù)據(jù)持續(xù)保護在本地設(shè)備時,并可把本地CDP 數(shù)據(jù)復(fù)制一份到異地,CDP 的卷可以直接在異地直接掛載使用,結(jié)合虛擬機功能實現(xiàn)應(yīng)用級容災(zāi)。
3、方案優(yōu)勢
數(shù)據(jù)保護系統(tǒng)提供的數(shù)據(jù)備份、CDP 及歸檔功能一體解決方案,滿足醫(yī)院信息系統(tǒng)的數(shù)據(jù)安全、應(yīng)用級容災(zāi)及法規(guī)要求(電子病歷數(shù)據(jù)長期保存的要求)的業(yè)務(wù)需求,解決方案優(yōu)勢如下:
1)軟硬一體化結(jié)構(gòu),數(shù)據(jù)保護系統(tǒng)是多功能于一體的數(shù)據(jù)保護設(shè)備。包含了備份、CDP、存儲(FC、ISCSI 及 NAS)及數(shù)據(jù)歸檔等多種功能,更加經(jīng)濟實用。并且部署簡單,插入網(wǎng)線后進行簡單配置后即可開始使用。
2)支持 FC、千兆及萬兆網(wǎng)絡(luò)等鏈路,靈活部署。
3)在同一臺設(shè)備支持部署定時備份、CDP 功能,針對不同應(yīng)用級別提供不同的保護方式。
4)具備遠程復(fù)制功能,兩臺以上的設(shè)備可以實現(xiàn)遠程復(fù)制,任意兩臺設(shè)備都可以作為發(fā)送端與接收端進行相互的遠程復(fù)制,實現(xiàn)異地容災(zāi),使數(shù)據(jù)更加安全。
5)具有高級備份功能,能實現(xiàn) PACS 等大量的非結(jié)構(gòu)化數(shù)據(jù)的不打包備份,可實現(xiàn) 100TB 級別以上的非結(jié)構(gòu)化數(shù)據(jù)的光盤庫出庫歸檔,同時采用高級備份時光盤庫恢復(fù)可通過備份系統(tǒng)和光盤庫直接恢復(fù)等多種方式恢復(fù)方式,更加安全可靠。
6)運維簡單,本方案采用一體化部署,提供統(tǒng)一的運維界面,用戶操作簡單,備份歸檔自動化完成。同時也提供完善的系統(tǒng)報告,方便客戶使用。