一、容錯技術(shù)的意義
容錯的含義比較寬泛,這種不確定性容易引發(fā)歧義,增加理解上的難度。從概念上來說,容錯是指服務器對于錯誤的容納能力,是應用過程中對于服務器穩(wěn)定性追求的一個目標。服務器的容錯技術(shù)一般是指由于種種原因在系統(tǒng)中出現(xiàn)了數(shù)據(jù)、文件損壞或丟失時,系統(tǒng)能夠自動將這些損壞或丟失的文件和數(shù)據(jù)恢復到發(fā)生事故以前的狀態(tài),服務器還具備繼續(xù)工作的能力,使系統(tǒng)能夠連續(xù)正常運行的一種技術(shù)。容錯系統(tǒng)一般有兩種,既有因具備熱備份方案而允許出錯的系統(tǒng),也有對出錯非常敏感的系統(tǒng)。這里的“出錯”既有人為因素,也有非人為原因。
雖然在一般情況下,信息系統(tǒng)的故障不會給企業(yè)運作帶來什么影響,但在某些關鍵時刻,系統(tǒng)的故障就會給企業(yè)帶來不可挽回的影響和損失,這對醫(yī)院、報社、工廠、金融機構(gòu)等而言,尤其重要。容錯技術(shù)的產(chǎn)生和應用正是在這種客觀需求下應運而生的。容錯技術(shù)的逐步成熟,使得具備容錯功能的服務器具備了更高的可用性和可維護性,而且容錯服務器還可以降低用戶的總體擁有成本,更多的企業(yè)開始把目光從雙機熱備轉(zhuǎn)向了具有容錯技術(shù)的服務器平臺。
具備容錯技術(shù)的服務器是通過對服務器的關鍵部件采用冗余配置的模式,當出現(xiàn)操作失誤或系統(tǒng)故障時,服務器的容錯機構(gòu)可以及時發(fā)現(xiàn)、及時補救所出現(xiàn)的系統(tǒng)故障,以保護文件、恢復并保持系統(tǒng)的正常運行。而專業(yè)的容錯服務器則能夠自動分離故障模塊,在不中斷運行的情況下,進行模塊調(diào)換,對損壞的部件進行維護,并且在一切物理故障消除后,系統(tǒng)會自動恢復同步運行。容錯服務器在“可靠性、可用性、可管理性、可維護性、可兼容性、可擴展性”等設計方面得到了更好的保障。
二、如何保護服務器
在容錯服務器領域,通常采用以下三種方式保護服務器,一是把兩臺服務器共享磁盤陣列柜做成集群,二是在兩臺服務器間安裝雙機容錯軟件,三是單機容錯。它們各自所對應的容錯級別也是從低到高的,也就是說,服務器群集技術(shù)容錯級別最低,而單機容錯技術(shù)級別最高。
(一)雙機熱備份技術(shù)所采用的是兩臺配置完全一樣的服務器系統(tǒng),操作系統(tǒng)的應用程序安裝在兩臺服務器的本地系統(tǒng)盤上,整個網(wǎng)絡系統(tǒng)的數(shù)據(jù)是通過磁盤整理集中管理和備份數(shù)據(jù)的。數(shù)據(jù)集中管理是通過雙機熱備份系統(tǒng),將所有站點的數(shù)據(jù)直接從中央存儲設備讀取和存儲,并由專業(yè)人員進行管理,保護了數(shù)據(jù)的安全性和保密性。
(二)單機容錯服務器則是通過CPU時鐘鎖頻,通過對系統(tǒng)中所有硬件的備份,包括CPU、內(nèi)存和I/O總線等的冗余備份,通過系統(tǒng)內(nèi)所有冗余部件的同步運行,實現(xiàn)真正意義上的容錯。任何系統(tǒng)部件的故障都不會造成系統(tǒng)停頓和數(shù)據(jù)丟失。
(三)雙機熱備的容錯模式和單機容錯服務器的定位稍有不同,雙機熱備一般可以實現(xiàn)99.9%的可用性,單機容錯卻可以實現(xiàn)99.999%的可用性。這樣,雙機熱備份大多應用在業(yè)務連續(xù)性不是很嚴格的行業(yè),比如公安系統(tǒng)或者個別的制造企業(yè),這些行業(yè)的應用允許數(shù)據(jù)有一小段時間的中斷。而如電信、金融、證券和醫(yī)療等要求高的行業(yè)則是容錯服務器的天下。
另外,雙機熱備容錯方式由于至少需要2臺服務器,導致在軟件采購(操作軟件、中間件、雙機備份軟件等)、系統(tǒng)維護升級、系統(tǒng)硬件升級都需要比單機容錯方式多1倍的額外投入,而且在雙機熱備份軟件出現(xiàn)故障時,其維修的難度較高,會給客戶帶來較大的困難。因此,雖然單機容錯服務器的硬件成本高于雙機備份方式的硬件投入,而其總成本卻遠遠低于雙機備份方式的成本。
三、容錯系統(tǒng)應用
進入21世紀以來,制造、中小企業(yè)、能源、交通等領域?qū)Ψ⻊掌鳎貏e是中低端IA服務器的需求激增,過去僅僅可以應用在RISC平臺、HP-UX環(huán)境下的容錯產(chǎn)品也面臨著新的挑戰(zhàn)。另一方面,企業(yè)越來越依賴信息系統(tǒng)來完成關鍵業(yè)務的應用,同時他們不可能配備更多的專業(yè)人員來進行專職維護。雙機熱備、集群服務器遇到難題。尤其對24小時不間斷,長期工作負責核心的服務系統(tǒng),需要具備容錯服務。
在煉鋼的L2控制層當中,采用的是四臺Stratus容錯ftServer4300服務器,分別作為預處理、電路/轉(zhuǎn)爐、煉爐及連鑄數(shù)據(jù)庫服務器,容錯服務器的二級PCS系統(tǒng)具備如下特征:
系統(tǒng)開放性:容許哦服務器一般應用的是工業(yè)行業(yè)標準設計,系統(tǒng)具備良好的開放性,采用的是RedHat Linux操作系統(tǒng),數(shù)據(jù)庫應用的是oracle,今后軟件的移植、系統(tǒng)的升級均很方便。
系統(tǒng)的可靠性:容錯服務器應用部件級冗余,因此關鍵的核心組件都是冗余的,采用美國容錯公司的專有的硬件時鐘同步技術(shù),冗余的容錯硬件的部件在同一時鐘周期下執(zhí)行相同的運算,在一個部件出現(xiàn)故障的情況下,其冗余部件就像激活了備份一樣,繼續(xù)正常工作;服務器系統(tǒng)的零切換時間保證了實時數(shù)據(jù)的完整性和可靠性,結(jié)合容錯的故障安全軟件及主動服務體系結(jié)構(gòu),從而保證了系統(tǒng)的99.999%的可用性。
經(jīng)過對于現(xiàn)有硬件平臺的分析,鋼鐵廠熱軋生產(chǎn)線二級過程控制系統(tǒng)與數(shù)據(jù)庫系統(tǒng)選用了Stratus ftServer容錯系統(tǒng)。此系統(tǒng)應用的是緊密封裝的機架或機柜配置,且第三代容錯系統(tǒng)繼承了ftServer技術(shù)的可靠性,再加上精細的行業(yè)標準模塊化部件設計,結(jié)合相關操作系統(tǒng)的可用性、高性能、安全特點,這樣完全能夠滿足生產(chǎn)的需要。
核心關注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務領域、行業(yè)應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業(yè)務領域的管理,全面涵蓋了企業(yè)關注ERP管理系統(tǒng)的核心領域,是眾多中小企業(yè)信息化建設首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.oesoe.com/
本文網(wǎng)址:http://www.oesoe.com/html/consultation/1083935704.html