至少在IT領(lǐng)域還沒(méi)有出現(xiàn)鞋匠的孩子沒(méi)有鞋穿的現(xiàn)象。
在過(guò)去的幾十年當(dāng)中,IT運(yùn)維團(tuán)隊(duì)一直使用大量先進(jìn)工具。即便如此,許多IT管理挑戰(zhàn)似乎仍然十分難以解決。但是這些問(wèn)題的“最后防線”已經(jīng)被新一代工具所攻破,這些工具采用更加復(fù)雜的分析算法來(lái)描述問(wèn)題并且提出解決方案。
“許多廠商在大數(shù)據(jù)和數(shù)據(jù)分析領(lǐng)域推出了多種新的工具,能夠幫助企業(yè)解決內(nèi)部運(yùn)營(yíng)、高可用性以及用戶(hù)體驗(yàn)方面存在的問(wèn)題,”IDC企業(yè)系統(tǒng)管理軟件部門(mén)副主席TimGrieser表示,“其中的創(chuàng)新在于從大數(shù)據(jù)和數(shù)據(jù)分析的角度考慮來(lái)自于不同源的超大規(guī)模數(shù)據(jù)。”
這些數(shù)據(jù)一部分來(lái)源于廠商自己的工具,還有一部分來(lái)自于更為廣泛的數(shù)據(jù)類(lèi)型,特別是“線路數(shù)據(jù)”,其中包含了大多數(shù)通過(guò)線纜或者傳輸協(xié)議、穿越計(jì)算機(jī)和遠(yuǎn)程通訊網(wǎng)絡(luò)的數(shù)據(jù)。使用這些工具的最終目的在于采用一種全新方式來(lái)評(píng)估系統(tǒng)性能、可用性和用戶(hù)體驗(yàn),理解、分析、最終解決這些問(wèn)題。
“理想情況下,這種全新方式能夠比過(guò)去取得更好的效果,未來(lái),用戶(hù)可以預(yù)測(cè)并且防止問(wèn)題的發(fā)生,”Grieser表示。這是關(guān)于服務(wù)可靠性和用戶(hù)體驗(yàn)的問(wèn)題,F(xiàn)在,分析工具能夠收集各種信息,從終端用戶(hù)到IT基礎(chǔ)架構(gòu)的運(yùn)營(yíng)數(shù)據(jù)以及業(yè)務(wù)方面提供的各種信息,他進(jìn)一步解釋道。
企業(yè)已經(jīng)發(fā)現(xiàn)這些最新出現(xiàn)的智能工具能夠?yàn)槠鋷?lái)很大好處。“最佳使用場(chǎng)景是排錯(cuò),”他說(shuō)。企業(yè)能夠擺脫過(guò)去的“救火隊(duì)員”的角色,從危機(jī)應(yīng)對(duì)逐漸轉(zhuǎn)為日常管理。
“通過(guò)分析來(lái)自于各個(gè)方面的數(shù)據(jù),企業(yè)IT部門(mén)也許能夠安靜下來(lái),找到基礎(chǔ)架構(gòu)和應(yīng)用程序當(dāng)中所出現(xiàn)問(wèn)題的合理解決方案,”他還注意到,可以采用SaaS(軟件即服務(wù))或本地等各種方式進(jìn)行部署。比如,作為智能IT工具的典型代表之一,Splunk提供了基于云的SaaS以及傳統(tǒng)的企業(yè)內(nèi)部智能運(yùn)營(yíng)平臺(tái)。企業(yè)通常選擇使用云環(huán)境以避免計(jì)算和存儲(chǔ)大量數(shù)據(jù)所產(chǎn)生的高昂開(kāi)銷(xiāo)。另一方面,選擇在本地進(jìn)行部署的企業(yè)大多數(shù)是由于數(shù)據(jù)隱私和數(shù)據(jù)安全方面的限制。
“在過(guò)去的許多年當(dāng)中,這些應(yīng)用程序都能夠幫助我們應(yīng)對(duì)這些IT挑戰(zhàn),而現(xiàn)在ExtraHop和BMC等公司的產(chǎn)品提供了額外的大數(shù)據(jù)分析和機(jī)器學(xué)習(xí)功能,”ESG集團(tuán)的分析師DanConde表示。
更加高效的IT部門(mén)
和其他業(yè)務(wù)功能不同的是,大數(shù)據(jù)的使用方式更加開(kāi)放,IT部門(mén)只需要針對(duì)幾種具體情況進(jìn)行分析。這些分析結(jié)果可以被用來(lái)提升IT部門(mén)的工作效率,發(fā)現(xiàn)問(wèn)題,提升安全性并且加快響應(yīng)速度。已經(jīng)發(fā)生的變化是大數(shù)據(jù)允許企業(yè)存儲(chǔ)比以往更多的信息,網(wǎng)絡(luò)排錯(cuò)軟件和設(shè)備可能產(chǎn)生超大規(guī)模數(shù)據(jù)。
“大數(shù)據(jù)技術(shù)的興起為整個(gè)行業(yè)帶來(lái)了新的活力,我們可以看到越來(lái)越多的傳統(tǒng)廠商對(duì)曾經(jīng)發(fā)生問(wèn)題的基礎(chǔ)架構(gòu)和工程方法從更深的角度進(jìn)行理解并且做出改進(jìn),”ESG分析師NikRouda表示。
這種勞動(dòng)密集型、效率低下的工作方式必須從根本上進(jìn)行改變。IT部門(mén)當(dāng)中的很多系統(tǒng)都會(huì)產(chǎn)生日志和數(shù)據(jù),這些數(shù)據(jù)當(dāng)中包含了系統(tǒng)的運(yùn)行情況(以及錯(cuò)誤),這是一個(gè)分析的絕佳機(jī)會(huì)。由于這些數(shù)據(jù)當(dāng)中的絕大部分都是非結(jié)構(gòu)性的,因此非常適合于使用大數(shù)據(jù)技術(shù)進(jìn)行分析。數(shù)據(jù)來(lái)源非常清晰,可以通過(guò)定義“閥值”進(jìn)行監(jiān)控,但是通常大數(shù)據(jù)工具能夠發(fā)現(xiàn)一些隱藏的數(shù)據(jù)類(lèi)型——或者至少對(duì)人類(lèi)來(lái)說(shuō)不那么明顯的特征。
不只是IT部門(mén)產(chǎn)生的數(shù)據(jù),現(xiàn)在所有的數(shù)據(jù)都能夠被分析。
“現(xiàn)在,包括Gartner在內(nèi)的大多數(shù)企業(yè)中都能夠看到‘線路數(shù)據(jù)’——其被視為實(shí)現(xiàn)IT性能和可用性管理的最重要來(lái)源;甚至比基于設(shè)備或者主機(jī)的數(shù)據(jù)來(lái)源更加重要,”ExtraHop公司市場(chǎng)和業(yè)務(wù)部高級(jí)副總裁ErikGiesa解釋說(shuō),這家公司專(zhuān)注于交付IT智能和業(yè)務(wù)運(yùn)營(yíng)方面的虛擬報(bào)告和數(shù)據(jù)分析。
以ExtraHop需要分析的一組數(shù)據(jù)為例,其中包含了針對(duì)250個(gè)數(shù)據(jù)包所進(jìn)行的實(shí)時(shí)預(yù)處理、測(cè)量和計(jì)算,需要使用不同協(xié)議和數(shù)據(jù)負(fù)載,在四個(gè)系統(tǒng)之間相互交換。“如果我們僅僅將上面的數(shù)字乘以十,真實(shí)環(huán)境當(dāng)中也許是成百上千,那么通過(guò)了解實(shí)時(shí)系統(tǒng)分析每秒鐘所需要處理的事務(wù)數(shù)量,你就能夠體會(huì)其智能程度和規(guī)模大小了,”Giesa表示。
這種不斷進(jìn)化的能力是非常重要的,他解釋道,因?yàn)槿绻褂冕槍?duì)單一事務(wù)的抓包和網(wǎng)絡(luò)工具,即便是十幾個(gè)人都無(wú)法完成這些測(cè)量和計(jì)算任務(wù),更不用說(shuō)每秒鐘幾千個(gè)事務(wù)了。針對(duì)頁(yè)面加載時(shí)間、帶寬使用情況、事務(wù)規(guī)模、訂單ID和盈利情況等提取相關(guān)數(shù)據(jù)之后進(jìn)行分析,同時(shí)確保數(shù)據(jù)庫(kù)事務(wù)能夠正確運(yùn)行,“已經(jīng)超過(guò)了傳統(tǒng)IT運(yùn)維監(jiān)控工具的能力范圍,因此需要使用APM(應(yīng)用程序性能管理)、NPM(網(wǎng)絡(luò)性能管理)和日志聚合產(chǎn)品”他還說(shuō)到。原因是這些信息當(dāng)中只有非常小的一部分是由應(yīng)用程序或者設(shè)備記錄的,因此使用代理來(lái)收集和分析這些數(shù)據(jù)是不切實(shí)際的,特別是在大規(guī)模情況下。“設(shè)想現(xiàn)在loT(物聯(lián)網(wǎng))、SDN(軟件定義網(wǎng)絡(luò))、容器以及微服務(wù)等這些趨勢(shì),企業(yè)不能使用代理或者自助報(bào)告日志等方式來(lái)管理這些傳感器、網(wǎng)絡(luò)或者微服務(wù)。唯一能夠分析這些活動(dòng)和行為的方式就是使用線路數(shù)據(jù),”Giesa表示。
“這種大數(shù)據(jù)分析技術(shù)能夠起到很大幫助作用,比如,對(duì)于安全問(wèn)題來(lái)說(shuō)。一個(gè)經(jīng)常被錯(cuò)誤報(bào)告的偶然SQL注入問(wèn)題可能不會(huì)引起管理員的注意,但是大數(shù)據(jù)分析能夠迅速發(fā)現(xiàn)其為異常行為,”Rouda表示。
在這種情況下,管理員能夠更加迅速地發(fā)現(xiàn)問(wèn)題,并且鍛煉解決復(fù)雜問(wèn)題的能力——比如資源利用率問(wèn)題——也就不足為怪了,他解釋道。
這個(gè)領(lǐng)域非常適合投資,因?yàn)槠湓贗T部門(mén)自己的控制范圍之內(nèi),需要遵守內(nèi)部操作流程。“其使用一項(xiàng)技術(shù)來(lái)改進(jìn)另外一項(xiàng)技術(shù)——這就是其被廣泛接受的原因,”他說(shuō)。這種趨勢(shì)已經(jīng)促進(jìn)一些全新廠商的出現(xiàn),其中最知名的就是Splunk。同時(shí)還有許多“服務(wù)等級(jí)管理工具廠商”比如BMC,以及其他一些網(wǎng)絡(luò)公司。
未來(lái)發(fā)展趨勢(shì)
Splunk的核心平臺(tái)——Ent
ERPrise6.4——能夠研究、監(jiān)控和分析來(lái)源于多種不同環(huán)境的機(jī)器數(shù)據(jù),從用戶(hù)訪問(wèn)頁(yè)面和事務(wù)處理情況到安全事件以及網(wǎng)絡(luò)活動(dòng)。其使用一系列的研究、分析、虛擬化和預(yù)封裝的實(shí)際案例,幫助IT部門(mén)發(fā)現(xiàn)問(wèn)題和分享觀點(diǎn)。根據(jù)公司提供的資料,這些案例包括應(yīng)用程序交付、IT運(yùn)維、安全和合規(guī)、業(yè)務(wù)分析以及物聯(lián)網(wǎng)等方面。超過(guò)1000個(gè)Splunk應(yīng)用和插件還能夠交付預(yù)封裝的視圖、dashboard以及工作流。
與其類(lèi)似的是,BMC的SaaS平臺(tái)TrueSightIntelligence使用RESTAPI來(lái)獲取IT運(yùn)維和業(yè)務(wù)數(shù)據(jù),自動(dòng)學(xué)習(xí)這些系統(tǒng)的行為。之后將這些信息輸出到圖形界面,這樣用戶(hù)就能夠查看應(yīng)用程序的健康狀態(tài)和性能表現(xiàn)以及一些關(guān)鍵的性能指標(biāo)了。
CloudPhysics同樣能夠收集用戶(hù)數(shù)據(jù)中心的多種數(shù)據(jù),之后從容量、性能的角度對(duì)數(shù)據(jù)中心的整體風(fēng)險(xiǎn)和健康程度進(jìn)行深入分析。此外,CloudPhysics還能夠?qū)⒚總(gè)客戶(hù)的數(shù)據(jù)集和自己的全局?jǐn)?shù)據(jù)集進(jìn)行比較——這個(gè)一個(gè)包含全部匿名用戶(hù)相關(guān)數(shù)據(jù)的集合。通過(guò)這種方式用戶(hù)能夠以其他組織的數(shù)據(jù)為基準(zhǔn)對(duì)自己的情況進(jìn)行對(duì)比分析。這種分析能夠幫助用戶(hù)決定是否購(gòu)買(mǎi)新的服務(wù)器、資源的使用效率是否偏低,甚至是決定哪種應(yīng)用程序最適合運(yùn)行在云當(dāng)中。
應(yīng)用程序的重要性
核心分析對(duì)于IT部門(mén)來(lái)說(shuō)一直非常重要。“我們必須監(jiān)控對(duì)業(yè)務(wù)至關(guān)重要的任何數(shù)字服務(wù),”BMC公司性能和可用性部門(mén)總裁BillBerutti表示。
特別是最近,隨著應(yīng)用程序的逐漸普及以及用戶(hù)體驗(yàn)重要性的不斷增強(qiáng),應(yīng)用程序市場(chǎng)的發(fā)展帶動(dòng)了數(shù)據(jù)分析需求的增加。日志分析也變得十分重要,BillBerutti再次表示像BMC這樣的公司已經(jīng)能夠成功使用日志來(lái)分析是否存在問(wèn)題以及這些問(wèn)題位于應(yīng)用程序或者基礎(chǔ)架構(gòu)的哪一層。
最近,隨著互聯(lián)網(wǎng)服務(wù)的大規(guī)模興起,數(shù)據(jù)分析變得比以往更加重要。“那些大型顛覆性的公司,比如Airbnb和Uber,就是打破行業(yè)數(shù)據(jù)分析傳統(tǒng)的極端案例,我打賭IT分析一定是這些公司業(yè)務(wù)的重要組成部分,”Berutt說(shuō)到,“對(duì)于這些企業(yè)來(lái)說(shuō),如果應(yīng)用程序不能正常工作,那么業(yè)務(wù)也就不復(fù)存在了。”
但是IT分析不僅局限于這些互聯(lián)網(wǎng)業(yè)務(wù)。“零售商和金融機(jī)構(gòu)也開(kāi)始面臨著相同的情況,”他說(shuō)。
比如,過(guò)去銀行的競(jìng)爭(zhēng)優(yōu)勢(shì)在于ATM機(jī)數(shù)量;現(xiàn)在移動(dòng)設(shè)備上的App使得24小時(shí)銀行變?yōu)榭赡,其能夠輕松、快速和方便地查詢(xún)賬戶(hù)余額并且處理支票儲(chǔ)蓄,而實(shí)現(xiàn)這些功能需要強(qiáng)大的分析能力。
一些企業(yè)的IT部門(mén)嘗試使用大數(shù)據(jù)技術(shù)幫助自己完成相關(guān)功能,但是“在數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)方面遇到很多挑戰(zhàn),因?yàn)榇蠖鄶?shù)傳統(tǒng)IT部門(mén)并不具有相關(guān)技能,”他說(shuō)。
前景分析
除了分析如何“修復(fù)”問(wèn)題之外,另外一個(gè)主要關(guān)注點(diǎn)是預(yù)測(cè)性分析。過(guò)去企業(yè)能夠針對(duì)這個(gè)領(lǐng)域當(dāng)中的某個(gè)方面實(shí)現(xiàn)自己的目標(biāo),但是現(xiàn)在主流的機(jī)器學(xué)習(xí)算法已經(jīng)能夠從多個(gè)角度進(jìn)行根本原因分析,因此能夠應(yīng)對(duì)大量問(wèn)題,Berutti說(shuō)。
機(jī)器學(xué)習(xí)能夠很好地應(yīng)對(duì)IT部門(mén)所面臨的各種挑戰(zhàn),ESG公司的Rouda也同意這種觀點(diǎn)。“使用機(jī)器學(xué)習(xí)技術(shù)企業(yè)能夠查看各種網(wǎng)絡(luò)活動(dòng),真正開(kāi)始學(xué)習(xí)到底發(fā)生了哪些事情,”他還說(shuō)到。
一個(gè)大型芯片制造商的案例印證了這種說(shuō)法,這家公司的報(bào)告顯示其每天需要面對(duì)800億到1000億個(gè)網(wǎng)絡(luò)事件,因此雇傭了數(shù)十個(gè)安全專(zhuān)家來(lái)嘗試?yán)斫庀到y(tǒng)相關(guān)動(dòng)態(tài)。然而,正如Rouda所說(shuō),這種挑戰(zhàn)是無(wú)論多少人都無(wú)法應(yīng)對(duì)的。
另一方面,使用機(jī)器學(xué)習(xí)技術(shù)“我們能夠?qū)⑦@些數(shù)據(jù)進(jìn)行分組,輸入不同的集群當(dāng)中,而員工可以監(jiān)控整個(gè)流程并且進(jìn)行改進(jìn),”Rouda說(shuō),“不能使用機(jī)器完成所有工作,因?yàn)闄C(jī)器不可能理解所有數(shù)據(jù)的含義,但是其非常善于在不同數(shù)據(jù)之間建立聯(lián)系。并且事實(shí)上,這就是真正需要進(jìn)行變化的地方。”
他預(yù)測(cè)市場(chǎng)的首要增長(zhǎng)點(diǎn)將會(huì)是廠商向其現(xiàn)有客戶(hù)群體推銷(xiāo)機(jī)器學(xué)習(xí)和大數(shù)據(jù)分析技術(shù),之后進(jìn)一步擴(kuò)展市場(chǎng)規(guī)模。“每個(gè)IT員工需要負(fù)責(zé)的應(yīng)用數(shù)量和數(shù)據(jù)規(guī)模一直在不斷增加,但是IT預(yù)算卻趨于平緩,因此這種創(chuàng)新能夠讓管理流程更加高效,”Rouda最后表示。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.oesoe.com/
本文標(biāo)題:大數(shù)據(jù)復(fù)興IT運(yùn)營(yíng)分析
本文網(wǎng)址:http://www.oesoe.com/html/consultation/10839719554.html