計算機系統(tǒng)在為企業(yè)各類應用系統(tǒng)提供強大支撐的同時,無時無刻不面臨著系統(tǒng)崩潰的危險。計算機硬件故障、病毒侵害、人為誤操作、自然災難等情況的發(fā)生都會讓系統(tǒng)變得極其脆弱,一旦系統(tǒng)癱瘓,通常的解決辦法只能是購置設備(配件)、重裝系統(tǒng)、安裝應用軟件、完成配置操作等等繁瑣的工作,可見系統(tǒng)在短時間內是無法恢復正常使用的。但作為一個企業(yè)的生產系統(tǒng).必須保證生產業(yè)務不中斷、不受影響,因此適合的應急恢復技術是保證系統(tǒng)穩(wěn)定運行的關鍵。中國石油油氣生產信息系統(tǒng)是油田生產業(yè)務重要的信息系統(tǒng)之一。為保證系統(tǒng)的穩(wěn)定運行,采用了目前計算機系統(tǒng)恢復技術中較為先進的冗災恢復技術和方法。本文通過對中國石油油氣生產信息系統(tǒng)是如何實現(xiàn)對生產系統(tǒng)的快速恢復和異地冗災的闡述,論述應急恢復技術在企業(yè)信息系統(tǒng)中的應用。
1 信息系統(tǒng)現(xiàn)狀與需求
中國石油油氣生產信息系統(tǒng)是管理油氣田勘探與生產過程的重要信息系統(tǒng)之一,系統(tǒng)建設范圍覆蓋了中國石油總部和各油氣田分公司,是集數(shù)據(jù)采集、存儲、傳輸、處理、分析、發(fā)布和服務于一體的現(xiàn)代化勘探開發(fā)信息管理系統(tǒng)。系統(tǒng)自建設完成,保證7×24h不間斷運行,全面服務于油氣田油氣生產。
油氣生產信息系統(tǒng)前端應用層服務器使用windows2003操作系統(tǒng),之上安裝有TWs、LPM、CDMT、Dss等多種油氣生產管理專業(yè)軟件,后臺使用0racle9i數(shù)據(jù)庫,同時,系統(tǒng)掛接有磁盤存儲系統(tǒng)和帶庫系統(tǒng)等共同組成完整的架構體系。系統(tǒng)穩(wěn)定運行離不開完備的應用程序架構和軟件產品,同時建立合理、完善的備份與應急恢復機制是確保系統(tǒng)安全、穩(wěn)定運行必不可少的前提條件。各類災害以及人為誤操作導致計算機系統(tǒng)崩潰、數(shù)據(jù)丟失的情況屢見不鮮,面對災難和故障做好系統(tǒng)和生產數(shù)據(jù)的快速恢復工作就顯得尤為重要。為增強油氣生產信息系統(tǒng)應對各種風險的恢復能力,對該系統(tǒng)部署實施了應急恢復子系統(tǒng),應急恢復子系統(tǒng)的建成保證了油氣生產信息系統(tǒng)的安全、穩(wěn)定、高效,同時為中國石油打造了一個堅實的油氣生產信息平臺。
2 應急恢復技術實現(xiàn)
2.1應急恢復系統(tǒng)方案設計原則
應急恢復系統(tǒng)方案設計必須遵守以下原則:高可用性的原則;運維簡捷,容易操作,可管理性高的原則;以不犧牲原系統(tǒng)的強壯性原則;保證生產系統(tǒng)正常運行原則;系統(tǒng)層、應用層具有高強容錯能力設計的原則。同時,需要保證生產系統(tǒng)生產數(shù)據(jù)任何情況下不丟失,本地備份與異地災備相結合的原則。當災難發(fā)生時應急恢復系統(tǒng)恢復正常工作時間<10min,在線恢復回寫系統(tǒng)和數(shù)據(jù)時間<4h,災難發(fā)生時系統(tǒng)管理員能遠程控制切換操作,快速恢復系統(tǒng)正常工作。
2.2應急恢復系統(tǒng)方案設計
根據(jù)信息系統(tǒng)現(xiàn)狀與需求,結合當前災備恢復技術進行分析論證,系統(tǒng)采用集中災備模式。由于信息系統(tǒng)的前端應用層和后臺數(shù)據(jù)庫層在運行方式、備份需求與內容上有很大的不同,為了做到有針對性的災備與恢復.我們對應用層系統(tǒng)采用“網絡盤存儲鏡像”備份技術,對數(shù)據(jù)庫層系統(tǒng)采用“遠程數(shù)據(jù)庫準同步”備份技術。
整個應急恢復系統(tǒng)架構設計實現(xiàn)本地系統(tǒng)數(shù)據(jù)保護和異地冗災接管的功能。系統(tǒng)總體設計框架如圖1所示。

圖1系統(tǒng)總體設計框架
“網絡盤存儲鏡像”(注:硬件設備+軟件系統(tǒng))技術主要是將windows操作系統(tǒng)及其上的應用軟件、數(shù)據(jù)庫等在系統(tǒng)運行正常時保存在“網絡盤存儲鏡像”中,并可多版本快照保存。當災難發(fā)生時,服務器可以拋開本地(內置)硬盤不用,直接從“網絡盤存儲鏡像”啟動操作系統(tǒng)、應用軟件和數(shù)據(jù)庫系統(tǒng),這種啟動方式所掛的“網絡盤存儲鏡像”盤是可讀寫的,也就是說它完全可代替原應用服務器工作,快速恢復生產應用。然后再利用生產空閑時間將當前版本寫回主應用服務器系統(tǒng),使主服務器恢復正常工作。“網絡盤存儲鏡像”的另一優(yōu)勢還可多版本存儲Windows操作系統(tǒng),可根據(jù)實際需求回滾到之前存儲過的任何一個windows版本。
對應用層windows系統(tǒng),在每個油田部署一個(組)“網絡盤存儲鏡像”系統(tǒng),各油田的應用服務系統(tǒng)都備份在“網絡盤存儲鏡像”中,并可多版本快照保存。然后在北京總部再部署一組“網絡盤存儲鏡像”系統(tǒng),在油田“網絡盤存儲鏡像”系統(tǒng)與總部“網絡盤存儲鏡像”系統(tǒng)之問做一個實時增量數(shù)據(jù)同步,從而做到各個油田的應用系統(tǒng)實時備份到總部。當油田系統(tǒng)出現(xiàn)故障不能從當?shù)貑訒r,可以由總部服務器從總部備份系統(tǒng)啟動代替各油田的服務器應用系統(tǒng)。
對0racle數(shù)據(jù)庫系統(tǒng),利用部署好的“網絡盤存儲鏡像”系統(tǒng),使用遠程數(shù)據(jù)庫準同步方案,所有備份數(shù)據(jù)都直接放在總部,利用數(shù)據(jù)復制同步軟件技術實現(xiàn)總部數(shù)據(jù)與各油田數(shù)據(jù)準實時同步。
2.2.1應用層服務器系統(tǒng)恢復
利用“網絡盤存儲鏡像”技術將windows操作系統(tǒng)及其上的應用軟件、系統(tǒng)服務等在系統(tǒng)正常運行時實時的保存到“網絡盤存儲鏡像”設備中,并可進行多版本快照保存。但是過多的快照會影響系統(tǒng)L/O讀寫性能,占用一定量的系統(tǒng)資源,根據(jù)各油田使用油氣生產信息系統(tǒng)的使用頻度和使用峰值時段,每6h定制一個快照,共4個快照即可滿足業(yè)務需求,同時備份體保存64d(256/4)!熬W絡盤存儲鏡像”的一個優(yōu)勢是可多版本存儲,可根據(jù)實際需要回滾到任何一個“干凈”版本,理論上它能防止任何操作系統(tǒng)故障、應用軟件故障、數(shù)據(jù)庫故障以及人為的誤操作等引起的系統(tǒng)或者軟件故障。
當故障引起的系統(tǒng)崩潰在短時間(4h)內無法修復生產系統(tǒng)時,服務器可以拋開本地硬盤不用,直接從“網絡盤存儲鏡像”啟動操作系統(tǒng)、應用軟件,從而快速恢復生產系統(tǒng)。整個恢復過程根據(jù)流程進行恢復、接管硬盤及軟件系統(tǒng)故障:應用服務器因病毒、操作系統(tǒng)、應用軟件、硬盤發(fā)生故障時,只需從本地網絡重啟服務器就會接替原應用服務器系統(tǒng)工作。然后再利用生產空閑時間將當前版本寫回主應用服務器系統(tǒng),使主服務器恢復正常工作。其他硬件故障如:服務器主板、網卡等非硬盤故障時,由后備服務器從網絡盤存儲鏡像設備網絡啟動,接替原服務器工作。主服務器修理后,根據(jù)硬盤數(shù)據(jù)情況再決定是否采用回寫方式恢復系統(tǒng)。
由于北京總部和各油田應急恢復系統(tǒng)是進行實時增量同步的,所以當油田出現(xiàn)故障不能從油田本地啟動,或是油田系統(tǒng)在長時問(4h以上)無法恢復,如:機房整體搬遷、機房停用、地震、地質災害等均可啟用異地冗災接管,即啟動總部的備份來接管故障油田應用。
2.2.2生產數(shù)據(jù)恢復
生產數(shù)據(jù)使用遠程數(shù)據(jù)庫準同步方案,利用數(shù)據(jù)復制同步純軟件技術進行準實時同步,各油田所有生產數(shù)據(jù)復制到北京總部,時間差應在180s以內。生產數(shù)據(jù)數(shù)據(jù)庫采用軟件方式,需要在各個油田的數(shù)據(jù)庫服務器上安裝同步軟件,在總部需要建立相應存儲,并安裝同步軟件,實現(xiàn)數(shù)據(jù)同步。
當生產數(shù)據(jù)服務器發(fā)生故障時,因這種方式是將生產數(shù)據(jù)寫入遠程的總部數(shù)據(jù)系統(tǒng)中,這樣無論是主服務器的硬件、操作系統(tǒng)、數(shù)據(jù)庫系統(tǒng)出現(xiàn)故障,還是存儲硬件、軟件出現(xiàn)故障,總部數(shù)據(jù)庫備份系統(tǒng)均能很快接替它,使其快速恢復生產數(shù)據(jù)應用。
2.3應急恢復系統(tǒng)特點
冗災系統(tǒng)的建設具有技術復雜、需求依賴性高的特點,各類技術方案不僅要實現(xiàn)冗災復制,還要按照業(yè)務需求實現(xiàn)各類災難的快速恢復,同時還要對現(xiàn)有的生產系統(tǒng)和網絡環(huán)境具有適應性,不產生負面的后果。
系統(tǒng)采用虛擬化技術在信息整合、信息復制、信息備份等多個方面的獨特能力,為各種應用系統(tǒng)提供有效的數(shù)據(jù)保護,實現(xiàn)“實時備份+多版本快照+瞬間恢復+遠程災備”,具體表現(xiàn)在以下方面:
1)實現(xiàn)生產數(shù)據(jù)遠程復制和本地時問點保護,使系統(tǒng)在本地快速恢復和遠程冗災接管有機結合,實現(xiàn)既具有冗災能力又提供本地快速恢復能力的冗災系統(tǒng)。
2)256個在線多版本自動快照供選擇。256個快照相當于256個全備份,利用快照.一旦發(fā)生任何一類故障,管理員都可以找到最近或特定的快照版本,進行立即恢復,從快照中恢復數(shù)據(jù)只是幾分鐘的事情。多版本快照支持應用系統(tǒng)的系統(tǒng)盤和數(shù)據(jù)盤的全面地實時保護,從而實現(xiàn)操作系統(tǒng)和應用數(shù)據(jù)的同步保護。
3)“塊增量+壓縮+加密”的網絡傳輸特性,支持基于塊增量的遠程數(shù)據(jù)復制功能,節(jié)省用于遠程復制的網絡帶寬,加密的遠程網絡傳輸功能,保證數(shù)據(jù)體傳輸?shù)目旖菖c安全。
4)利用網絡盤啟動操作系統(tǒng)和回滾啟動功能,可瞬間恢復系統(tǒng)。
5)支持指定目錄和指定文件的選擇性恢復。根據(jù)需要,利用實時鏡像和多點快照,在任意時間恢復任意目錄和文件。
6)集成多點自動快照技術的冗災系統(tǒng),實現(xiàn)了由人為誤操作類“災難”的防范及糾錯功能。
7)全面保護數(shù)據(jù)庫系統(tǒng)和windows操作系彩應用系統(tǒng)。傳統(tǒng)的備份系統(tǒng)主要針對數(shù)據(jù)系統(tǒng)提供保護,而該系統(tǒng)是一體化快速恢復系統(tǒng)和災備系統(tǒng),對Windows操作系統(tǒng)、生產業(yè)務應用系統(tǒng)和數(shù)據(jù)庫系統(tǒng)提供實時的數(shù)據(jù)保護和一鍵式快速恢復機制。
3 結論
通過應急恢復技術在中國石油油氣生產信息系統(tǒng)的應用研究實例可以看出.采用“網絡盤存儲鏡像”技術的災備系統(tǒng)可以為企業(yè)信息系統(tǒng)提供一個開放的、易于擴展的存儲平臺,他不僅幫助我們構建了一個高效的遠程異地冗災系統(tǒng),同時也為我們提供了本地實時備份系統(tǒng)和快速恢復系統(tǒng),構建了一個可以應對各種系統(tǒng)故障和災難恢復的安全體系,為企業(yè)生產打造一個安全穩(wěn)定的系統(tǒng)平臺。
核心關注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務領域、行業(yè)應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業(yè)務領域的管理,全面涵蓋了企業(yè)關注ERP管理系統(tǒng)的核心領域,是眾多中小企業(yè)信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.oesoe.com/
























