目前,企業(yè)級服務器主要應用于處理大量數(shù)據(jù)、對數(shù)據(jù)處理速度和可靠性要求較高的企業(yè)和重要行業(yè),它可為企業(yè)提電子商務、ERP(企業(yè)資源配置)、OA(辦公自動化)等服務。
1、服務器硬件分析
1.1硬件性能分析
為了更快地發(fā)現(xiàn)企業(yè)級服務器的故障并對其進行有效排除,必須對其特性有深入的了解。企業(yè)級服務器類屬高檔服務器,大都支持4’8個PIII Xeon(至強)或P4 Xeon(至強)處理器,并擁有獨立雙PCI通道及內(nèi)存擴展板設計,要具有高內(nèi)存的帶寬、大容量的熱插拔硬盤及電源、強大的數(shù)據(jù)處理功能,同時還要求必須有高度容錯的能力、優(yōu)異的系統(tǒng)及系統(tǒng)擴散性能和超長的系統(tǒng)運行時間。
1.2硬件分類
按企業(yè)級服務器的架構不同,可分為CISC架構服務器與RISE架構服務器。CISC架構服務器采用的是英特爾架構技術,通常我們所說的PC服務器就是CISC架構服務器,而RISC架構服務器采用的則是非英特爾架構技術,比如采用Alpha、PowERPc、PA—RISC、Sparc等RISC CPU的服務器。就兩種服務器的性價比來說,RISC架構服務器LgClSC架構服務器要高出許多,而且隨著計算機技術的飛速發(fā)展,RISC架構服務器與IA架構服務器間的技術差距也變得越來越小,由于性價比的原因,很多要求相對不高的企業(yè)選擇IA架構服務器。但RISC架構服務器在許多大關鍵、大型的應用領域,仍占據(jù)十分重要的地位。
2、服務器常見故障分析
2.1硬件故障
正常情況下,服務器硬件發(fā)生故障的概率較低,主要故障多數(shù)是由服務器內(nèi)部的散熱受阻等問題引起的,因此,要經(jīng)常檢查服務器的相關散熱部件,察看是否有因灰塵較多而影響通風散熱等現(xiàn)象。其次是由于硬件耗損而出現(xiàn)的故障,按常見的硬件故障率,可將企業(yè)級服務器硬件的故障出現(xiàn)率從低到高排列為電源系統(tǒng)、CPU、內(nèi)存、外部總線以及負載系統(tǒng)。接觸不良的現(xiàn)象在硬件故障中比較常見,主要是各種內(nèi)存、卡類及CPU等部件與主板間的接觸不良,或者是電源線及數(shù)據(jù)線的接觸不良。這種故障相對比較容易解決,可以通過更換相關位置的插槽或者擦拭金手指等方法來解決。
2.2軟件故障
企業(yè)級服務器中的軟件故障約占服務器故障的70%,是服務器故障中出現(xiàn)機率較大的故障。引起服務器軟件出現(xiàn)故障的因素有很多,較為常見的有:服務器BIOS版本過低、服務器管理軟件或驅動程序中有BUG、應用程序故障以及人為的軟件故障等。此外,還有因為軟件升級和病毒導致的軟件停止運行與意外斷電等。服務器軟件的故障診斷比較復雜,首先應明確是否是不當?shù)娜藶椴僮饕鸬模缓笤俑鶕?jù)相關日志、警示聲響、錯誤代碼及可疑程序等來進行診斷。軟件故障中最難診斷的便是軟件沖突所引起的故障,這種故障更多的是要求管理人員和維護人員有足夠的經(jīng)驗及高度的觀察分析能力。病毒也是引起軟件故障的關鍵因素之一,雖然不能稱其為主機故障,但它同樣也引起了服務器的運行問題,因此將病毒也歸為軟件故障。一些病毒的發(fā)作現(xiàn)象跟硬件或軟件故障的現(xiàn)象十分類似,引導型病毒便是其中典型的一個例子。大多數(shù)病毒一開始是依附在系統(tǒng)的某一個軟件或是用戶程序上面,然后再進行擴散。病毒發(fā)作時會威脅服務器正常的運行,破壞數(shù)據(jù)和程序?梢酝ㄟ^攻擊面的減小、安全更新的應用、防火墻的啟用及漏洞掃描程序等方法來進行病毒防護。此外,還要注意黑客的入侵等原因引起的服務器故障,在服務器構建的初期制定安全防護方案,物力防御和軟件防御同時進行。
3、服務器故障排除
3.1硬件故障排除
目前很多企業(yè)級服務器都自帶有硬件固件測試程序,利用硬件固件測試程序和故障的代碼顯示結果,便可對故障做出初步的診斷定位。按照主機硬件負載的相關理論,在確保主機硬件正常運行的情況下,對主機的最小化負載進行診斷,準確地找出故障點后,再通過更換硬件來完成服務器的硬件維修工作。另外,還應該注意網(wǎng)關問題,假如網(wǎng)關出現(xiàn)了問題,將會直接導致不能正常連接等問題的出現(xiàn)。這種情況比較容易處理,只需更換網(wǎng)關,故障便可排除。
3.2軟件故障排除
對企業(yè)級服務器的軟件故障進行排除,必須要經(jīng)常對FIPd㈣ARE與BIOS進行更新,其次也不能忽視對服務器軟件的更新,經(jīng)常對其進行更新可解決由BUG等軟件問題所引起的軟件故障。另外也要注意,錯誤的升級方法也可能導致服務器出現(xiàn)軟件故障等問題,可以進行服務器內(nèi)部程序清除、相關日志檢查等工作來完成服務器故障的排除。最后是人為因素引起的軟件故障,這類故障可通過相關的培訓來解決,讓相關人員進行專業(yè)的學習,養(yǎng)成好的機器使用習慣,經(jīng)常保存數(shù)據(jù),防止由于意外停電或非正常操作等因素而引起的意外關機及數(shù)據(jù)丟失現(xiàn)象的發(fā)生。
企業(yè)級服務器是整個企業(yè)信息得以有效運行的關鍵,服務器故障的分析與排除,更多的是依靠維護人員的意識、經(jīng)驗與細心。服務器日常的維護工作也是必須的,其所處環(huán)境對其本身的的影響是十分重要的,它直接影響到服務器硬件的使用壽命。因此,要保持服務器所處環(huán)境的溫度和濕度,還要有必要的防火、防水及防塵等措施。在對軟件進行維護時可以從網(wǎng)絡系統(tǒng)、操作系統(tǒng)、數(shù)據(jù)庫和用戶數(shù)據(jù)等方面進行,及時做好漏洞補丁安裝、數(shù)據(jù)優(yōu)化和數(shù)據(jù)備份等工作,同時還要在更換或卸載設備的時候做好斷電、主機接地等工作,防止由靜電引起的設備損壞。
轉載請注明出處:拓步ERP資訊網(wǎng)http://www.oesoe.com/
本文標題:企業(yè)級服務器故障分析及排除
本文網(wǎng)址:http://www.oesoe.com/html/support/11121511674.html