1 前言
重慶建設摩托車股份有限公司(以下簡稱重建摩)是中國兵器裝備集團公司下屬的國有大型制造業(yè)企業(yè),公司源于1889年張之洞所創(chuàng)漢陽兵工廠,發(fā)展歷程跨越了三個世紀, 成為在中國具有舉足輕重地位的大型軍工企業(yè),曾先后迎來毛澤東、鄧小平、江澤民等黨和國家領導人的親臨視察。現(xiàn)已形成年產摩托車發(fā)動機200萬臺、整車200萬輛的能力,產品暢銷70多個國家和地區(qū)。公司信息化水平2011年底達中國兵器裝備集團公司信息化A級水平,部分信息化指標達到精益4.0級以上,信息化水平處于行業(yè)先進水平。進入2011年后,公司的IT運維管理逐步由傳統(tǒng)的粗放型IT運維管理朝“綠色IT運維管理”發(fā)展。
2 前期背景
進入2011年以來,重慶建設摩托車股份有限公司的信息化水平發(fā)展到了一定的階段,應用系統(tǒng)已經涵蓋了從研發(fā)到銷售的各個環(huán)節(jié),此外還有辦公自動化、條碼、一卡通、DMS等數(shù)十個緊密關聯(lián)的應用系統(tǒng)。信息系統(tǒng)在企業(yè)生產經營活動中顯示出越來越重要的地位,生產經營越來越依賴信息系統(tǒng)。隨著信息化在工廠的不斷深入,我們發(fā)現(xiàn)信息化運維的規(guī)范、制度、技術手段等管理模式遠遠落后于信息化的發(fā)展速度,新形勢下信息系統(tǒng)的運維管理越發(fā)蒼白無力。其次是每增加一個應用系統(tǒng)就需要相應配套相關的應用服務器,服務器蔓延的趨勢越來越明顯,從而導致投資不可控,管理難度增大、能耗增高。所以,希望兩個方面來提升我們對信息系統(tǒng)管理的能力。第一,建立完善的信息化管理體系,以適應新形勢下的信息化運維工作。第二,借助新技術的運用,來提升數(shù)據(jù)中心的效率,降低投資和能耗。于是,重建摩在2011年7月開始,對信息化管理規(guī)范以貼近實際工作的原則進行了大刀闊斧的變革,同時實施了云平臺和桌面終端管理項目。擬通過云平臺和桌面終端精細化管理的實施,減少IT固定資產的投入而節(jié)約投資,降低能耗,努力打造“綠色”數(shù)據(jù)中心。
3 綠色IT運維管理實踐的內涵及主要做法
3.1 綠色IT運維的內涵
此實踐以提高公司信息化的運維管理能力,降低公司IT投資和運維管理成本為目標,通過詳實而有效的管理規(guī)范、制度的建設,建成了運維管理的三級規(guī)范體系;通過引進高新技術,如云計算及桌面精細化管理,對其進行二次消化和利用,實現(xiàn)了運維工作效率提升,運維水平上升到更高的層次,大幅降低公司IT新增投資及運維費用的目的。實現(xiàn)節(jié)能達10余萬度/年的經濟效益。綠色、環(huán)保、穩(wěn)定、高效的數(shù)據(jù)中心已初具雛形。
3.2主要做法
開展此課題主要有以下兩部分內容:一是建立新型的符合信息化條件的運維管理體系。二是利用新技術,提高服務器利用率及管理的靈活性,提升管理效率,降低能耗。
3.2.1運用ITIL、PDCA等管理理論,建立信息系統(tǒng)三層級運維管理體系,實現(xiàn)信息系統(tǒng)的動態(tài)管控;
建立三級運維管理體系之前,運維管理工作以下幾方面的問題或隱患:
·管理制度、規(guī)范較零散,不成體系,且許多管理規(guī)范都是幾年以前建立的,在信息化高速發(fā)展的時代,這些規(guī)范遠遠不能滿足要求,許多規(guī)范和制度不貼近實際,對工作的直接指導性很差。
·因為沒有明確規(guī)定框架和標準及工作內容,運維管理人員的流程、工作職責、工作內容不是特別明確,導致有時處理問題過程延遲。
·由于沒有對工作問題的記錄、跟蹤、改進、解決等環(huán)節(jié),問題處理方式還局限在指哪打哪的救火式解決方式,運維管理人員經常疲于應付各種棘手問題。
·因為沒有成體系的標準和指標進行監(jiān)控,運維工作質量難以得到量化,無法進行考核考評。
·因缺乏固化的工作手冊和操作步驟,在信息化行業(yè)人力資源變化頻繁的形勢下,如出現(xiàn)運維人員變化,繼任者很難在短時間內快速上手。
如何搭建三級運維管理體系:
·運用ITIL理念,對原有管理規(guī)范進行評估、優(yōu)化,對運維管理規(guī)范進行增補、修訂、完善。此為第一層級的管理要素。
搭建了信息系統(tǒng)運維管理總體框架,通過對原有的部分規(guī)范,制度和操作手冊等進行重新評估,祛除相當部分格式化語言,以可操作、可檢查、可量化的原則,制定和修訂相關管理流程、規(guī)范,此類文件作為指導實際工作的方向性文檔,與大的業(yè)務和業(yè)務流程相吻合,規(guī)定了在業(yè)務流程中運維管理人員應該做什么、怎么做。其主要包含《數(shù)據(jù)中心運維管理規(guī)范》、《重建摩公司信息化系統(tǒng)應急預案》、《IT運維標準工作流程》等20余個管理規(guī)范、及流程手冊。
·引入全面質量管理中常用的PDCA(戴明環(huán))理論,建立信息系統(tǒng)運行監(jiān)控指標、信息系統(tǒng)維護標準;此為第二層級管理要素。
第二層級的管理要素就是在第一層級管理規(guī)范的框架內,繼續(xù)細化和衍生,建立起比第一層級相對更細的工作標準、管控指標,此標準和指標,就是為了更好地檢查、衡量運維人員的運維工作質量。另一方面,也是重建摩運維管理人員管理數(shù)據(jù)中心、網(wǎng)絡系統(tǒng)、硬件系統(tǒng)的不可缺少的管理要素,利用此層級的標準和指標,能夠在實際工作中指導運維管理人員的工作究竟要做到什么程度才算圓滿完成。此類指標與標準是根據(jù)PDCA(戴明環(huán))方法來建立的,需要我們的工作在P(計劃)D(實施)C(檢查)A(改進)的各個階段都要有量化指標,來檢查核實運維人員的運維管理工作的質量。
·建立信息系統(tǒng)運維操作流程、操作手冊、點檢表等控制文檔;此為第三層級管理要素。
第三層級的管理要素就是繼續(xù)深化和細化相關運維操作細則,在重點的工作項上,制定符合實際的操作流程、工作手冊、操作手冊、點檢表格等。這個層級的管理要素與第二層級、第一層級是一脈相承的,而且是不斷細化和完善的過程體現(xiàn)。此類手冊類、表格類的管理文件,把關重工作進行了固化,明確規(guī)定第一步如何做,第二步如何做。運維工作的標準化、規(guī)范化管理就體現(xiàn)于此。同時這樣也能夠把復雜、龐大的運維技術和技能保存下來,如運維工作人員發(fā)生人事變動,新的員工能比以往更快的接手運維工作。圖1為三級運維管理體系架構圖。
圖1.三級運維管理體系架構圖
通過三級運維管理要素的建立,重建摩信息化運維管理體系已初具雛形,同時也發(fā)揮了它應有的作用。通過公司內部民意調查和信息化指標的數(shù)據(jù)體現(xiàn),公司目前的運維管理工作較1年前有了大幅提高,重建摩的IT設備維修及時率、關重設備故障率、非計劃停機時間等指標大幅降低,業(yè)務單位人員對運維人員的服務質量和服務態(tài)度等均有較高的評價。
建立三級運維管理體系之后,運維管理工作水平得到了明顯提升:
·通過梳理原有部分規(guī)范和業(yè)務流程、新建和修訂規(guī)范后,建成了三級運維管理規(guī)范體系,由粗至細,規(guī)范了各個業(yè)務流程和操作要領。運維工作的標準化規(guī)范化水平得到很大提升。
·運維人員在實際工作中有了可供參考的流程、職責、內容等要素,運維工作進行較以往更順利。
·因按規(guī)范和標準要求建立了問題控制表,定期對問題進行分析,找出易發(fā)故障點,運維保障能力大大加強,具備了一定的故障預估能力和問題的快速處理能力。
·運維工作因為管控指標和標準的建立,達到了可以量化的程度,重建摩信息管理部定期發(fā)布運維工作的月度報告,可詳實記錄月度工作量。
·對人力資源的變化,重建摩信息管理部具備了更強的應對措施和能力。有了全新的操作手冊和操作指導書,繼任員工能在短時間內快速掌握一線運維技能和技巧。
3.2.2引入新技術、新工具,提升服務器利用率,強化終端管理;
·運用服務器虛擬化技術,搭建云服務平臺。
通過調研,我們發(fā)現(xiàn)通過服務器虛擬化技術可以有效整合數(shù)據(jù)中心服務器資源,實現(xiàn)服務器利用率提升,同時保障原有的安全性和穩(wěn)定性,從而達到降低投資和能耗的目的。并且該技術已在全球得到了廣泛的應用,在國內也有很多成熟的案例。
a.引進云平臺之前的管理狀態(tài):
①應用服務器龐雜,一個應用系統(tǒng)必須配備對應的應用服務器。固定資產投資居高不下。
②由于服務器眾多,運維管理的難度很大。不能做到統(tǒng)一集中運維。
③由于單個應用在單臺服務器上,數(shù)據(jù)的穩(wěn)定性和安全性風險很高。
④采購應用服務器時,需要立項、評審、招標、合同等幾個階段,采購服務器時間很長,過程中也耗費大量的人力物力。
針對我公司的實際情況,我們在對比不同的虛擬化技術解決方案后,采用了國際上較為領先的“VMware”軟件系統(tǒng)作為重建摩的云平臺。其部署的主要步驟為:
①與實施方充分溝通,了解云平臺部署細節(jié),制定部署計劃,分析在部署過程中可能會出現(xiàn)的問題,制定相應的應急預案。
②對所有的服務器進行性能分析,將性能最好的兩臺服務器作為云平臺的硬件資源,以利于后期最大限度的多部署應用系統(tǒng)。
③對現(xiàn)有應用系統(tǒng)進行分析,確定可以將哪些應用部署在云平臺上。通過對比分析,初步確定將原來部署在8臺服務器上的8個應用部署在云平臺上。
④進行云平臺軟、硬件系統(tǒng)的配置,分配存儲資源,部署前期規(guī)劃的應用系統(tǒng)。
⑤在保證原應用系統(tǒng)不中斷的前提下,對部署在云平臺之上的應用進行全面測試。
⑥通過測試后,啟用云平臺上的應用。圖2為私有云平臺的架構圖。
圖2.私有云平臺的架構圖
目前為止,已經有上網(wǎng)行為日志、殺毒軟件系統(tǒng)、用友CPD系統(tǒng)、BI服務器系統(tǒng)等8個應用系統(tǒng)在虛擬服務器上運行。成功的減少了6臺應用服務器的配備。而且2臺服務器之間實現(xiàn)了高可用,也就是說,如果其中一臺VMware服務器出現(xiàn)故障,另外一臺完全可以立即擔負起所有的負載,對重建摩業(yè)務系統(tǒng)的穩(wěn)定性和業(yè)務數(shù)據(jù)的安全性提供了有力保障。
b.引進云平臺之后的管理狀態(tài):
①因為服務器的利用率得到了明顯提升,服務器的固定資產投資得到了延遲,節(jié)省了大量用于采購服務器的經費。
②系統(tǒng)運維管理人員比以往更方便的管理各種系統(tǒng)。由于界面是統(tǒng)一的,各類服務器的列表一應俱全,隨時可根據(jù)需要重啟和配置服務器。大大降低了服務器運維人員的管理復雜度,提升了管理效率。
③新增一臺應用服務器時,只需要在系統(tǒng)中做一些配置。時間可控制在2-3個小時內完成。省去了以往新增應用系統(tǒng)服務器時的立項、評審、招標、合同等環(huán)節(jié)。大大提升了效率。
④云平臺服務器分布在2臺服務器上,2臺服務器互相備份,具備高可用的特征。服務器硬件損壞并不會導致應用系統(tǒng)停止,數(shù)據(jù)也不會丟失。數(shù)據(jù)的安全性和系統(tǒng)可靠性得到了空前的提升。
·部署北信源桌面管理軟件,實現(xiàn)終端用戶精細化管理
桌面終端精細化管理,是IT運維管理的發(fā)展趨勢。它將管理的觸手從服務器端和網(wǎng)絡管控延伸至用戶終端設備上。由于用戶終端的行為各有不同,大量的不安全性和隱患主要集中在用戶終端上,這也是為什么要把桌面終端管理起來的理由。通過桌面終端精細化管理,我們可以從終端的行為、狀態(tài)、事件三個層面上對終端設備進行管理。及時獲取終端的運行狀態(tài)、安全狀態(tài)、補丁狀態(tài)等?梢詫⒍拒浖⒀a丁等進行遠程自動安裝,這一切用戶本身是無法察覺到的,換句話說就是不會影響終端用戶的體驗?梢栽O置終端設備的USB存儲開關,根據(jù)需要管理終端USB存儲開關狀態(tài),可以對終端設備遠程關機重啟,還能夠快速準確的統(tǒng)計接入網(wǎng)絡中的終端設備的數(shù)量、配置、忙閑度、操作系統(tǒng)基本情況等。利用這個系統(tǒng),IT運維管理人員就能輕松管理上千臺設備,對設備的狀態(tài)了然于心。
在實施北信源桌面終端管理系統(tǒng)之前管理上有以下問題:
①無法知曉終端設備的狀態(tài)和行為,終端運維人員手中的設備臺賬陳舊,無法動態(tài)自動更新,終端的不安全隱患較為突出。
②終端的數(shù)據(jù)外聯(lián)風險很大,數(shù)據(jù)可以通過USB端口隨意拷貝。數(shù)據(jù)泄密隱患突出。
③由于無法管理到終端設備,終端設備的管控權全部由終端使用者全權掌控,使用者的素質也千差萬別,導致終端設備頻繁出現(xiàn)各種問題。
④不能統(tǒng)一的對一些管理策略進行下發(fā),全靠傳統(tǒng)的一些通知要求終端需要安裝什么軟件,不能安裝什么軟件,但終端用戶不這么做也沒辦法去管控。
重建摩是2011年開始大規(guī)模的實施這個系統(tǒng),通過系統(tǒng)的實施,目前管理了上千臺終端設備,對技術中心等關重部門的設備設置了USB存儲禁用,這在一定程度上改變了企業(yè)敏感的設計數(shù)據(jù)被隨意拷貝的狀態(tài),保障了設計數(shù)據(jù)的安全性。在企業(yè)內部,由于經常有用戶下班后不關閉計算機,導致電能浪費很大,通過此系統(tǒng),能輕松把設置自動關機程序,到關機時間自動關機。一年來累計節(jié)約電費可達數(shù)十萬元。具有較高的管理和經濟效益。
實施了終端精細化管理系統(tǒng)之后,帶來的管理提升如下:
①隨時知曉終端行為和狀態(tài),自動更新安全補丁和殺毒系統(tǒng),終端的安全性得到了保證。
②可根據(jù)需要不允許某些終端用戶使用USB存儲設備,杜絕了隨意拷貝技術資料的行為,敏感的商業(yè)機密泄露渠道大大縮小。
③設備終端的管理權由終端使用的用戶轉變成信息化運維管理人員,可根據(jù)需要設置管理策略,信息化運維管理的觸手從以前的服務器或網(wǎng)絡延伸到終端設備上。
④可統(tǒng)一管理上千臺終端計算機設備,設置統(tǒng)一的管理策略,終端設備的規(guī)范化和標準化管理不再是遙不可及的夢想。
4 效果及效益分析
通過一系列管理提升措施,重建摩信息管理部成功建立起三級運維管理體系,通過嚴密的體系建立,軟實力得到了加強,運維管理工作開始逐步由被動應付轉向主動管控,具備一定的故障預估能力。通過高新技術的消化吸收利用,重建摩建立了內部私有云平臺,建立了精細化的桌面終端管理機制,首次對桌面終端設備進行了管控,這在過去是不敢想象的。
云平臺實現(xiàn)了8個應用的遷移:把重建摩公司的一卡通系統(tǒng)、用友CPD系統(tǒng)、DHCP系統(tǒng)、DNS系統(tǒng)、北信源內網(wǎng)安全管理系統(tǒng)、殺毒軟件系統(tǒng)、上網(wǎng)行為日志系統(tǒng)成功整合到2臺PC服務器上,而且都能穩(wěn)定的提供服務。節(jié)省了6臺PC SERVER配置。這6臺PC服務器將來就能用來做其他的業(yè)務,沒有通過服務器采購,實現(xiàn)了服務器的資源整合,而且還調劑了6臺富余服務器,根據(jù)服務器和機柜的功率計算,一年節(jié)約的電能不可小視。
終端設備管控實現(xiàn)了標準化,集約化。管理難度得到了降低,設備故障量較以往下降30臺次/月,電能消耗下降了7000余度/月。
具體效益如下:
1、服務器年省電效益=2KW(服務器單臺能耗)*6(6臺服務器)*24(小時)*365(天)*1.2元(工業(yè)用電單價)=126144元。
2、終端設備年省電效益=0.1KW(終端計算機單臺功耗)*300(平均300臺設備不關機)*12(小時)*220(天)*1.2元(工業(yè)用電單價)=95040元
3、節(jié)省IT固定資產投資效益=10萬元(服務器單價)*6(6臺服務器)=600000元。
4、運維管理效率提升效益=100元/人天*30天(平均節(jié)省的時間)*6人(平均參與服務器采購及運維的人數(shù))*6次=108000元
5、減少停工時間20余小時=20*12000元=240000元
實施一年來總經濟效益為:
126144+600000+108000+95040+240000=1169184元
核心關注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務領域、行業(yè)應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業(yè)務領域的管理,全面涵蓋了企業(yè)關注ERP管理系統(tǒng)的核心領域,是眾多中小企業(yè)信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網(wǎng)http://www.oesoe.com/
本文標題:綠色IT運維管理實踐
本文網(wǎng)址:http://www.oesoe.com/html/support/1112185646.html