1 引言
隨著油田信息化建設的不斷深入,油藏工程、采油工程、地面工程以及作業(yè)管理等各類專業(yè)應用系統(tǒng)為油田生產(chǎn)提供了高效、經(jīng)濟、便捷的生產(chǎn)管理手段,相關業(yè)務對信息技術的依賴在不斷加強。而由于用戶訪問量的快速增長造成的服務器壅堵及故障出現(xiàn)頻率也呈上升趨勢,給油田生產(chǎn)管理的順利開展帶來不穩(wěn)定因素。因此,確!7×24”小時持續(xù)運行能力是系統(tǒng)的基本要求。同時,油田生產(chǎn)數(shù)據(jù)的安全性也要求承載數(shù)據(jù)庫系統(tǒng)的服務器有較高的容錯能力、處理能力和擴展能力;诖鎯夹g、負載均衡技術及0racle RAC技術的數(shù)據(jù)庫集群系統(tǒng)能較好地滿足以上要求。
本文在研究構建高可用性數(shù)據(jù)庫集群系統(tǒng)相關技術的基礎上,將這一技術應用到大慶油田第二采油廠數(shù)據(jù)中心的生產(chǎn)數(shù)據(jù)庫系統(tǒng),顯著提高了系統(tǒng)的運行效率和容錯能力。取得了良好的效果。
2 集群技術
集群是一種并行或分布式的處理系統(tǒng),由相互獨立的、通過高速網(wǎng)絡互連的兩個或多個計算機(節(jié)點)組成,像一個單獨集成的計算資源一樣協(xié)同完成特定的任務。集群系統(tǒng)實現(xiàn)了單一系統(tǒng)映像,使系統(tǒng)內(nèi)所有物理資源和內(nèi)核資源可見,并被系統(tǒng)內(nèi)的所有節(jié)點訪問。操作者不必了解資源的物理位里,也不必知道應用程序在哪個節(jié)點上運行,而且可以將應用程序的多個共同工作的部件集中或分散管理,一方面簡化了系統(tǒng)管理,另一方面也提高了系統(tǒng)的性能。
2.1高可用性集群
計算機集群系統(tǒng)按應用目的可分為高可用性(HA)集群和高性能(HP)集群。高性能集群具有響應大量計算的性能,主要用于處理復雜的計算問題.如氣象云圖、分子模擬、神經(jīng)元計算等。而高可用性集群具有更高的可靠性和容錯性,是指以減少服務器中斷時間為目的實現(xiàn)故障屏蔽的服務器集群技術。在高可用集群環(huán)境下,若某臺服務器出現(xiàn)故障導致服務中斷,則預先設定的接管服務器會自動接管相關應用并繼續(xù)對用戶提供服務,具有更高的可用性、可管理性和更優(yōu)異的可伸縮性。
2.2高可用性集群的工作方式
高可用性集群可以有多種工作方式,雙節(jié)點的高可用性集群典型的工作方式有:
(1)主/主(Active/Active)式。集群中兩節(jié)點同時運行各自的應用并且相互監(jiān)側對方的狀態(tài),當一臺主機宕機后,預先設定好的另一臺主機立即接管它的一切工作。這種工作方式允許最大程度地利用硬件資源,一般要求各節(jié)點具有相等或相似的處理能力,所有的服務在故障轉(zhuǎn)移后仍保持可用。
(2)主/從(Active/Standby)式。主機工作,從機處于監(jiān)控準備狀態(tài),當主機宕機后,從機接管主機的一切工作,繼續(xù)為客戶機提供服務,待主機恢復正常后,用戶可以自行設定以自動或手動方式將服務切換到主機上,也可不切換。
3 集群架構
數(shù)據(jù)庫集群系統(tǒng)按架構可分為無共享存儲集群和共享存儲集群。主要區(qū)別在于是否濡要進行物理數(shù)據(jù)布局,將靜態(tài)的數(shù)據(jù)分區(qū)作為并行處理的前提。
在共享存儲方式下,每一臺服務器都可以訪問所有數(shù)據(jù)。服務請求可以按照不同的負載均衡算法在節(jié)點之間循環(huán),無需考慮哪些數(shù)據(jù)塊是被請求的。如果某一點發(fā)生單點故障,服務請求會自動路由到下一個可用節(jié)點,可用的服務器仍然能訪問所有數(shù)據(jù),不會破壞數(shù)據(jù)的可用性。這種方式擁有較高的整體可靠性,而且在這種方式下,往集群中增加節(jié)點無需重新配!結構、應用或基礎數(shù)據(jù)組織。不過這種訪問方式需要保證同一時間只有一個節(jié)點對某個數(shù)據(jù)塊進行訪問,不然會造成讀寫沖突。因此需要一個分布式的同步機制來對緩存更新和磁盤寫進行整體上的控制,以保證數(shù)據(jù)的完整性。
無共享集群不需要同步機制。因為無共享集群把數(shù)據(jù)分區(qū),每個數(shù)據(jù)區(qū)只能被一臺服務器訪問,這使得它可以更有效地位用緩存,從而獲得更高的響應性能。但設立分區(qū)要付出額外的計價,它需要應用和事務管理器來對分區(qū)的路由進行優(yōu)化。如果分區(qū)沒有被很好地優(yōu)化,獨立的分區(qū)節(jié)點會很快超載,而如果發(fā)生了單點故障,其他服務器不能訪問該數(shù)據(jù)區(qū),只有重新分區(qū)才傲解決,導致其故障恢復時間比共享磁盤集群長,從而影響數(shù)據(jù)跳可用性。而且往無共享集群中增加和側除節(jié)點比共享磁盤架牲要復雜得多,因為它涉及重新分配數(shù)據(jù)區(qū)的問題。對于以高可拜性為首要目標的數(shù)據(jù)庫集群系統(tǒng)而言,采用共享磁盤的架構更為合適。
4 系統(tǒng)實施
在大慶油田第二采油廠數(shù)據(jù)中心建立數(shù)據(jù)庫集群系統(tǒng)的過程中,根據(jù)已有設備情況和應用需求,采用了高可用性、共享存儲、主/主工作方式的實施方案(參見圖1)。
圖1 系統(tǒng)實施示意圖
采用的硬件設備包括:兩臺Sun V890工作站,各自安裝Solaria 10操作系統(tǒng)和集群組件,共享存儲為DPE CX500磁盤陣列,存儲容量為2TB,服務器通過千兆光纖網(wǎng)卡相互連接并共享磁盤陣列,每個節(jié)點具有自己的系統(tǒng)引導盤,可以獨立運行。在兩個節(jié)點上分別安裝Oracle RAC和Oracle 10g軟件,數(shù)據(jù)文件、控制文件、日志文件存儲在共享磁盤陣列上,節(jié)點上只創(chuàng)建共享數(shù)據(jù)庫的實例。整個集群系統(tǒng)對外有一個虛擬的IP地址,客戶端連接虛擬地址,達到單一的系統(tǒng)映像。這樣,當某個節(jié)點發(fā)生硬件或軟件故障時,系統(tǒng)可以把任務自動地切換到另一個節(jié)點,可以繼續(xù)提供數(shù)據(jù)庫服務,對用戶沒有影響。系統(tǒng)還提供了很高的有效性和可擴展性,在業(yè)務擴展,數(shù)據(jù)量增長,需要增加系統(tǒng)處理能力時,可以通過向集群中增加更多的節(jié)點,增加所支持用戶的數(shù)最,保持系統(tǒng)性能。
5 結束語
Oracle RAC作為一種高可用性應用集群,在故障容錯、并行處理及負載均衡等方面表現(xiàn)出突出的優(yōu)越性,本文根據(jù)數(shù)據(jù)中心的建設悄況,在Sun V890小型機上結合Oracle集群軟件實施了Oracle 10gRAC集群并取得了良好的效果。系統(tǒng)充分利用已有的服務器資源,在顯著降低單臺服務器訪問負載的同時,使數(shù)據(jù)中心的運行效率和容災能力大幅提高,為采油廠各項業(yè)務應用提供了一個高效、可靠的數(shù)據(jù)平臺。
核心關注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務領域、行業(yè)應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業(yè)務領域的管理,全面涵蓋了企業(yè)關注ERP管理系統(tǒng)的核心領域,是眾多中小企業(yè)信息化建設首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.oesoe.com/
本文標題:集群技術在采油廠數(shù)據(jù)中心的應用研究
本文網(wǎng)址:http://www.oesoe.com/html/support/1112153051.html