業(yè)務(wù)支撐系統(tǒng)是指由計(jì)算機(jī)硬件、存儲(chǔ)設(shè)備、網(wǎng)絡(luò)通訊設(shè)備、計(jì)算機(jī)軟件、信息資源和相關(guān)業(yè)務(wù)管理流程組成的以處理業(yè)務(wù)信息為目的的系統(tǒng)。業(yè)務(wù)支撐系統(tǒng)高可用是指系統(tǒng)應(yīng)對(duì)風(fēng)險(xiǎn)具有自動(dòng)調(diào)整和快速反應(yīng)的能力,以保證業(yè)務(wù)的連續(xù)運(yùn)轉(zhuǎn)。高可用保障體系由本地應(yīng)急系統(tǒng)和容災(zāi)系統(tǒng)組成,本地應(yīng)急系統(tǒng)、容災(zāi)系統(tǒng)與生產(chǎn)系統(tǒng)相互配合共同保證整體業(yè)務(wù)的連續(xù)性。
目前,傳統(tǒng)的應(yīng)急容災(zāi)方案通常基于本地設(shè)備高可用(如主備雙機(jī)、存儲(chǔ)柜間鏡像等)、異地?cái)?shù)據(jù)容災(zāi)復(fù)制等技術(shù),這些方案存在以下不足:(1)本地災(zāi)難時(shí)異地應(yīng)用恢復(fù)時(shí)間(RTO)較長(zhǎng)。當(dāng)發(fā)生本地機(jī)樓級(jí)災(zāi)難時(shí),異地的容災(zāi)主機(jī)需重新加載數(shù)據(jù),重新啟動(dòng),恢復(fù)時(shí)間估計(jì)為30~120分鐘,這樣會(huì)造成較大的損失;(2)異地容災(zāi)設(shè)備資源的浪費(fèi),在平時(shí)正常情況下,異地主機(jī)不承擔(dān)或承擔(dān)少量生產(chǎn)業(yè)務(wù),主機(jī)資源浪費(fèi)嚴(yán)重;(3)應(yīng)急容災(zāi)切換和災(zāi)難修復(fù)回切操作復(fù)雜,需制定完備的容災(zāi)管理體系,并定時(shí)演練,以保障災(zāi)難時(shí)操作的高效。
本文基于存儲(chǔ)虛擬化技術(shù)提出一種業(yè)務(wù)支撐系統(tǒng)容災(zāi)保障的新思路,可解決傳統(tǒng)高可用保障方案的不足。本地和遠(yuǎn)端同時(shí)承擔(dān)生產(chǎn)和容災(zāi)的角色,實(shí)
現(xiàn)業(yè)務(wù)雙中心雙活模式,一端發(fā)生災(zāi)難時(shí),另一端可實(shí)時(shí)接管。該方案基于存儲(chǔ)同步復(fù)制技術(shù)的雙活業(yè)務(wù)支持應(yīng)急系統(tǒng)應(yīng)用,采用虛擬化存儲(chǔ),實(shí)現(xiàn)兩個(gè)站點(diǎn)資源的同時(shí)使用,再配合使用文件集群系統(tǒng),生產(chǎn)端和容災(zāi)端在平時(shí)都承載生產(chǎn)業(yè)務(wù),分區(qū)域進(jìn)行業(yè)務(wù)分擔(dān)。理論上可實(shí)現(xiàn)同一個(gè)數(shù)據(jù)庫(kù)/文件系統(tǒng)被多個(gè)主機(jī)同時(shí)訪問(wèn),在本地和異地兩個(gè)數(shù)據(jù)中心節(jié)點(diǎn)上均可同時(shí)啟動(dòng)并對(duì)外提供服務(wù)。
1 業(yè)務(wù)支撐系統(tǒng)概述
1.1 系統(tǒng)設(shè)計(jì)的分層結(jié)構(gòu)
按系統(tǒng)功能架構(gòu)一般可分為IP網(wǎng)絡(luò)層、主機(jī)層、存儲(chǔ)網(wǎng)絡(luò)層和存儲(chǔ)層,各層的高可用設(shè)計(jì)如下:
IP網(wǎng)絡(luò)層:包括交換機(jī)、防火墻、路由器、負(fù)載均衡器等。通常采用主備雙平面設(shè)計(jì),當(dāng)主網(wǎng)絡(luò)平面某節(jié)點(diǎn)的網(wǎng)絡(luò)設(shè)備故障時(shí),自動(dòng)切換至另一個(gè)平面。
主機(jī)層:系統(tǒng)主機(jī)包括各類數(shù)據(jù)庫(kù)、中間件、后臺(tái)應(yīng)用、WEB和接口服務(wù)器等,通常采用雙機(jī)主備或雙機(jī)/集群負(fù)載均衡的部署方式。
存儲(chǔ)網(wǎng)絡(luò)層:存儲(chǔ)網(wǎng)絡(luò)是未用主機(jī)與磁盤(pán)陣列之間的高速的網(wǎng)絡(luò)傳輸中繼設(shè)備,通常采用光纖線纜作為傳輸介質(zhì),1+1負(fù)載均衡的方式實(shí)現(xiàn)高可用冗余。
存儲(chǔ)層:對(duì)于關(guān)鍵業(yè)務(wù)的存儲(chǔ)磁盤(pán)陣列,通常要求存儲(chǔ)盤(pán)陣具有雙控制器,甚至采用雙臺(tái)存儲(chǔ)盤(pán)陣,結(jié)合跨盤(pán)陣的數(shù)據(jù)鏡像方式實(shí)現(xiàn)本地高可用冗余。對(duì)于異地容災(zāi)需求則可采用各類遠(yuǎn)程數(shù)據(jù)復(fù)制技術(shù)實(shí)現(xiàn)數(shù)據(jù)異地容災(zāi)。
系統(tǒng)架構(gòu)如圖1所示。
圖1 信息系統(tǒng)架構(gòu)圖
1.2系統(tǒng)高可用的業(yè)務(wù)指標(biāo)
信息系統(tǒng)的高可用能力通?捎2個(gè)指標(biāo)來(lái)衡量,包括RTO(RecoveryTime Object)、RPO(RecoveryPoint Object)。RTO(恢復(fù)時(shí)間目標(biāo))是指災(zāi)難發(fā)生后,從IT系統(tǒng)宕機(jī)導(dǎo)致業(yè)務(wù)停頓開(kāi)始,到IT系統(tǒng)恢復(fù)至可以支持各部門(mén)運(yùn)作、業(yè)務(wù)恢復(fù)運(yùn)營(yíng)之時(shí)兩點(diǎn)之間的時(shí)間段;RPO(恢復(fù)點(diǎn)目標(biāo))是指一個(gè)過(guò)去的時(shí)間點(diǎn),當(dāng)災(zāi)難或緊急事件發(fā)生時(shí),數(shù)據(jù)可以恢復(fù)到的時(shí)間點(diǎn)。
2 三種高可用技術(shù)
2.1 存儲(chǔ)虛擬化技術(shù)
存儲(chǔ)虛擬化技術(shù)是在物理存儲(chǔ)系統(tǒng)和服務(wù)器之間增加一個(gè)虛擬層,管理和控制所有存儲(chǔ)并對(duì)服務(wù)器提供存儲(chǔ)服務(wù)。服務(wù)器不直接與存儲(chǔ)硬件打交道,存儲(chǔ)硬件的增減、調(diào)換、分拆、合并對(duì)服務(wù)器層完全透明。它屏蔽了存儲(chǔ)硬件的復(fù)雜程度,允許將現(xiàn)有的功能集成使用,擺脫了物理容量的局限。
存儲(chǔ)虛擬化主要有兩種實(shí)現(xiàn)方式:基于軟件和基于硬件引擎;谟布妫禾摂M引擎在一個(gè)專用的硬件設(shè)備上或光纖交換機(jī)上,從連接到SAN的存儲(chǔ)上劃分虛擬卷。典型產(chǎn)品有IBM SVC、EMCVPLEX;谲浖杭磳⑻摂M化軟件安裝在應(yīng)用主機(jī)上,在連接到主機(jī)的不同存儲(chǔ)上劃分虛擬卷。典型產(chǎn)品有Symantec VERITAS CFS。
存儲(chǔ)虛擬化技術(shù)提供同步復(fù)制功能,來(lái)自服務(wù)器的更新被寫(xiě)入本地連接的控制器集群(Cluster)的緩存,該系統(tǒng)將數(shù)據(jù)轉(zhuǎn)發(fā)給異地?cái)?shù)據(jù)中心連接的控制器集群的緩存。只有當(dāng)兩個(gè)控制器集群的緩存都擁有數(shù)據(jù)的拷貝以后本地系統(tǒng)才會(huì)向處理器返回一個(gè)I/O完成指示。同步遠(yuǎn)程拷貝能夠在異地?cái)?shù)據(jù)中心提供最新程度的數(shù)據(jù)當(dāng)前值。
通過(guò)利用存儲(chǔ)虛擬化技術(shù)的同步鏡像功能,可以保證本地源卷和遠(yuǎn)程目的卷的數(shù)據(jù)完全一致,由此保證了雙活數(shù)據(jù)中心的業(yè)務(wù)連續(xù)性。它屬于最底層硬件設(shè)備提供的“零切換”能力,相對(duì)于傳統(tǒng)容災(zāi)技術(shù)可以減少用戶的維護(hù)工作量,有效避免故障時(shí)技術(shù)平臺(tái)的切換操作過(guò)程。如圖2所示。
圖2 存儲(chǔ)虛擬化同步鏡像機(jī)制
2.2集群數(shù)據(jù)庫(kù)Oracle RACE
集群數(shù)據(jù)庫(kù)技術(shù)是將多臺(tái)數(shù)據(jù)庫(kù)服務(wù)器聯(lián)合起來(lái)組成集群,實(shí)現(xiàn)綜合性能優(yōu)于單個(gè)大型數(shù)據(jù)庫(kù)服務(wù)器的技術(shù)。Oracle RAC又為“真實(shí)應(yīng)用集群”,是其中最典型的產(chǎn)品,用于數(shù)據(jù)庫(kù)服務(wù)器的高可用。它采用緩存融合技術(shù),使各數(shù)據(jù)庫(kù)主機(jī)將它們的數(shù)據(jù)緩存合并為一個(gè)共享的全局緩存,從而利用所有存活節(jié)點(diǎn)的緩存和CPU資源,當(dāng)某節(jié)點(diǎn)發(fā)生故障時(shí),可從節(jié)點(diǎn)失效中快速恢復(fù)。如圖3所示。
圖3 Oracle RAC集群
2.3集群文件系統(tǒng)
集群文件系統(tǒng)可以實(shí)現(xiàn)同一個(gè)文件系統(tǒng)通過(guò)SAN光纖網(wǎng)絡(luò)同時(shí)被多個(gè)主機(jī)訪問(wèn),在邏輯卷層面上保證了雙數(shù)據(jù)中心的應(yīng)用對(duì)文件系統(tǒng)數(shù)據(jù)的并發(fā)雙活訪問(wèn)。應(yīng)用程序在雙數(shù)據(jù)中心節(jié)點(diǎn)上均可以同時(shí)啟動(dòng)并對(duì)外提供服務(wù),發(fā)生故障時(shí)無(wú)需切換。而且高可用集群可以自動(dòng)進(jìn)行業(yè)務(wù)的切換,降低了人工操作的難度和時(shí)間。
3 業(yè)務(wù)支撐系統(tǒng)容災(zāi)保障新思路探討
通過(guò)虛擬化存儲(chǔ)技術(shù),存儲(chǔ)可以異地部署,實(shí)現(xiàn)兩個(gè)數(shù)據(jù)中心的存儲(chǔ)資源同步。利用數(shù)據(jù)庫(kù)集群及集群文件系統(tǒng),實(shí)現(xiàn)源數(shù)據(jù)和災(zāi)備數(shù)據(jù)可同時(shí)被讀寫(xiě)。結(jié)合上述技術(shù)的優(yōu)勢(shì),我們得到一種新的存儲(chǔ)高可用技術(shù),進(jìn)而形成業(yè)務(wù)支撐系統(tǒng)容災(zāi)保障新思路——存儲(chǔ)雙活中心。其中,依據(jù)所使用的存儲(chǔ)虛擬化技術(shù)不同,存儲(chǔ)雙活中心可以有兩種設(shè)計(jì)方案實(shí)現(xiàn)。
3.1 基于存儲(chǔ)虛擬化硬件引擎的雙活存儲(chǔ)中心設(shè)計(jì)方案
在主機(jī)和IP網(wǎng)絡(luò)層,利用大二層以太網(wǎng)絡(luò)技術(shù),將本地和異地兩個(gè)數(shù)據(jù)中心的數(shù)據(jù)庫(kù)組成4節(jié)點(diǎn)的RAC(4節(jié)點(diǎn)RAC之間的Cache Fusion需要高速穩(wěn)定的網(wǎng)絡(luò)來(lái)保證)。本地故障時(shí),可使用異地RAC節(jié)點(diǎn)進(jìn)行業(yè)務(wù)接管,兩個(gè)數(shù)據(jù)中心節(jié)點(diǎn)RAC心跳網(wǎng)絡(luò)由大二層網(wǎng)絡(luò)提供。Web服務(wù)器本地采用負(fù)載均衡器的方式,異地進(jìn)行同等服務(wù)器性能配置;應(yīng)用及中間件服務(wù)器本地及異地使用相同配置。
在存儲(chǔ)網(wǎng)絡(luò)和存儲(chǔ)層,利用光纖鏈路,實(shí)現(xiàn)數(shù)據(jù)同步鏡像(存儲(chǔ)虛擬化+集群文件系統(tǒng))技術(shù)實(shí)現(xiàn)本地和遠(yuǎn)端的統(tǒng)一存儲(chǔ)池。通過(guò)虛擬化的存儲(chǔ)引擎,實(shí)現(xiàn)兩個(gè)站點(diǎn)資源的同時(shí)使用,再配合使用集群文件系統(tǒng),實(shí)現(xiàn)同一份文件系統(tǒng)數(shù)據(jù)被多個(gè)主機(jī)同時(shí)訪問(wèn),在雙數(shù)據(jù)中心節(jié)點(diǎn)上均可以同時(shí)啟動(dòng)并對(duì)外提供服務(wù),實(shí)現(xiàn)雙活模式。
本方案的優(yōu)點(diǎn)是可以實(shí)現(xiàn)不同站點(diǎn)的不同主機(jī)同時(shí)訪問(wèn)同一個(gè)數(shù)據(jù)庫(kù),實(shí)現(xiàn)雙活模式;單個(gè)站點(diǎn)發(fā)生故障或?yàn)?zāi)難時(shí),無(wú)需切換應(yīng)用便可快速接管。不足之處在于雙中心有距離限制,必須在100公里以內(nèi),并且對(duì)網(wǎng)絡(luò)延遲、帶寬、網(wǎng)絡(luò)質(zhì)量穩(wěn)定性要求高。圖4為基于存儲(chǔ)虛擬化硬件引擎實(shí)現(xiàn)的雙活方案。
圖4 基于存儲(chǔ)虛擬化硬件引擎實(shí)現(xiàn)雙活方案
3.2基于存儲(chǔ)虛擬化軟件的雙活存儲(chǔ)中心設(shè)計(jì)方案
在主機(jī)和網(wǎng)絡(luò)層,同樣利用大二層以太網(wǎng)絡(luò)技術(shù),將本地和異地兩個(gè)數(shù)據(jù)中心的數(shù)據(jù)庫(kù)組成4節(jié)點(diǎn)的RAC,與基于存儲(chǔ)虛擬化硬件引擎的雙活存儲(chǔ)中心設(shè)計(jì)方案一致。
在光纖網(wǎng)絡(luò)和存儲(chǔ)層,利用存儲(chǔ)虛擬化軟件和光纖鏈路實(shí)現(xiàn)本地和遠(yuǎn)端的統(tǒng)一存儲(chǔ)池,構(gòu)建生產(chǎn)存儲(chǔ)和容災(zāi)存儲(chǔ)為實(shí)時(shí)鏡像關(guān)系,實(shí)現(xiàn)存儲(chǔ)數(shù)據(jù)的遠(yuǎn)程容災(zāi),再配合使用集群文件系統(tǒng),實(shí)現(xiàn)同一份文件系統(tǒng)數(shù)據(jù)被多個(gè)主機(jī)同時(shí)訪問(wèn),在雙數(shù)據(jù)中心節(jié)點(diǎn)上均可以同時(shí)啟動(dòng)并對(duì)外提供服務(wù),實(shí)現(xiàn)雙活模式。
該方案去除對(duì)存儲(chǔ)虛擬化硬件的需求,采用軟件方式實(shí)現(xiàn)存儲(chǔ)虛擬化和存儲(chǔ)數(shù)據(jù)的實(shí)時(shí)鏡像,實(shí)現(xiàn)不同站點(diǎn)不同主機(jī)同時(shí)訪問(wèn)同一個(gè)數(shù)據(jù)庫(kù)的雙活模式;單個(gè)站點(diǎn)發(fā)生故障或?yàn)?zāi)難時(shí),無(wú)需切換應(yīng)用便可快速接管。缺點(diǎn)是雙中心距離更受限制,需要更大的帶寬和較低的延遲來(lái)保證性能,并且以軟件方式實(shí)現(xiàn)存儲(chǔ)虛擬化會(huì)額外消耗主機(jī)處理能力。存儲(chǔ)虛擬化軟件實(shí)現(xiàn)雙活方案見(jiàn)圖5所示。
圖5 基于存儲(chǔ)虛擬化軟件實(shí)現(xiàn)雙活方案
3.3雙活存儲(chǔ)中心與傳統(tǒng)應(yīng)急容災(zāi)系統(tǒng)比較
對(duì)存儲(chǔ)雙活中心與傳統(tǒng)應(yīng)急容災(zāi)系統(tǒng)進(jìn)行對(duì)比,見(jiàn)表1所示。
表1 業(yè)務(wù)效果的對(duì)比
4 結(jié)論
雙活數(shù)據(jù)中心方案可以實(shí)現(xiàn)在本地和遠(yuǎn)端兩個(gè)數(shù)據(jù)中心在同時(shí)提供業(yè)務(wù)支撐能力,作為一種應(yīng)急容災(zāi)新思路,能充分利用容災(zāi)主機(jī)的處理能力,減少資源浪費(fèi),同時(shí)又能解決業(yè)務(wù)系統(tǒng)在災(zāi)難及日常維護(hù)過(guò)程中造成的停機(jī)問(wèn)題,該思路同樣適用于其他大型、復(fù)雜的信息系統(tǒng)容災(zāi)。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.oesoe.com/
本文標(biāo)題:關(guān)于利用虛擬化技術(shù)實(shí)現(xiàn)業(yè)務(wù)支撐系統(tǒng)容災(zāi)保障的思路探討
本文網(wǎng)址:http://www.oesoe.com/html/support/1112159437.html