在談到大數(shù)據(jù)時(shí)代的現(xiàn)狀時(shí),英特爾中國(guó)有限公司存儲(chǔ)產(chǎn)品市場(chǎng)經(jīng)理亢海峰認(rèn)為,需要尊重實(shí)踐,需要找出大數(shù)據(jù)面前大家面臨的關(guān)鍵問(wèn)題,從中尋求更佳的解決之道。
CSF2012:英特爾中國(guó)有限公司存儲(chǔ)產(chǎn)品市場(chǎng)經(jīng)理亢海峰
當(dāng)前我們所面臨的數(shù)據(jù)和信息是變化的,數(shù)據(jù)生命周期已經(jīng)完全改變了。那么在傳統(tǒng)的數(shù)據(jù)中心方面,大家面臨什么樣的問(wèn)題,如何應(yīng)對(duì)和解決?在未來(lái)的云的數(shù)據(jù)中心方面,會(huì)面臨什么樣的問(wèn)題,大家又如何來(lái)解決?
在做存儲(chǔ)行業(yè)趨勢(shì)分析時(shí),亢海峰指出,“來(lái)自IDC的數(shù)據(jù)顯示,未來(lái)幾年間數(shù)據(jù)量從2011年的1.8ZB,在2015年會(huì)增長(zhǎng)為35個(gè)ZB。十年前,大家還在使用3.5英寸的盤,5.5英寸的盤,后來(lái)有了光盤和DVD,不同的介質(zhì),存儲(chǔ)的數(shù)據(jù)越來(lái)越多。
那么這些數(shù)據(jù)來(lái)源于什么?來(lái)源于個(gè)人和企業(yè)用戶不斷的膨脹的存儲(chǔ)需求。現(xiàn)在隨便一個(gè)手機(jī)就差不多八百萬(wàn)象素?cái)z像頭,意味著什么?大家每拍一張照片,就會(huì)上傳到網(wǎng)上,與朋友以不同形式的分享,類似這些數(shù)據(jù)不斷累計(jì)就形成了當(dāng)今爆炸性的數(shù)據(jù)時(shí)代。有越來(lái)越多的數(shù)據(jù)中90%是非結(jié)構(gòu)化的(主要是圖片和視頻為主)。
來(lái)自IDC的報(bào)告顯示,從2010年到2016年四種類型數(shù)據(jù)的增長(zhǎng)情況來(lái)看,首先傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),也既是說(shuō)數(shù)據(jù)中心里面常見的數(shù)據(jù)庫(kù),運(yùn)行核心的業(yè)務(wù),核心的交易。那么,這一類稱之為傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)
其次是傳統(tǒng)的非結(jié)構(gòu)化數(shù)據(jù),也就是企業(yè)里面有共享的文件和文檔,大家需要文件服務(wù)器,可以在一個(gè)系統(tǒng)里面共同分享知識(shí)。
再次,在數(shù)據(jù)備份方面,業(yè)務(wù)的數(shù)據(jù)量越來(lái)越大了,備份也增長(zhǎng)很快。很多數(shù)據(jù)是大家由于長(zhǎng)期歸檔的訴求所存在的。
最后就是共有云的數(shù)據(jù)。那么對(duì)于這種不同類型的四種數(shù)據(jù)哪一個(gè)增長(zhǎng)最快,肯定是公有云,也是大的數(shù)據(jù)領(lǐng)域的范疇。存儲(chǔ)的目的是為了滿足以上不同類型數(shù)據(jù)的存儲(chǔ)需求。
重新定義的數(shù)據(jù)生命周期
什么叫做重新定義的數(shù)據(jù)生命周期?以前大家探討的是什么?信息生命周期.“說(shuō)你有一個(gè)信息,它產(chǎn)生出來(lái),你創(chuàng)建了這個(gè)信息,過(guò)一段時(shí)間,達(dá)到了一個(gè)價(jià)值的高峰,大家對(duì)這個(gè)信息訪問(wèn)都很頻繁,都喜歡這個(gè)信息。然后過(guò)了一段時(shí)間,這個(gè)信息過(guò)時(shí)用不到了,就把數(shù)據(jù)刪除,這是傳統(tǒng)的生命周期,從出生,到高潮,到低谷,到刪除。”亢海峰說(shuō)道。
而現(xiàn)在的數(shù)據(jù),隨著數(shù)據(jù)的累積,隨著時(shí)間的推移,相應(yīng)的數(shù)據(jù)越來(lái)越多得到的信息就越來(lái)越多。新一輪數(shù)據(jù)量的積累之后就獲得新的數(shù)據(jù)價(jià)值,稱之為價(jià)值的排浪,它會(huì)呈排浪的形式逐漸從數(shù)據(jù)中挖掘出信息,這一切取決于取決于大家對(duì)于信息的理解和積累。
對(duì)于存儲(chǔ)來(lái)講怎么劃分這種周期?“最下面的存儲(chǔ)介質(zhì)大家基本上放在磁帶上需要長(zhǎng)期的歸檔.或者放在磁盤庫(kù)上,或者是大容量的,低成本的介質(zhì)上.對(duì)性能又一定需要的數(shù)據(jù)就用高速的磁盤,性能要求再高的用閃存盤,SSD等等的數(shù)據(jù)。
數(shù)據(jù)的生命周期已經(jīng)截然的改變了。今天對(duì)于數(shù)據(jù)的劃分是邏輯的劃分。第一,大量的不常訪問(wèn)的數(shù)據(jù),通過(guò)磁盤的介質(zhì)進(jìn)行長(zhǎng)期的歸檔。第二,這一層的數(shù)據(jù)一定要滿足不斷的增長(zhǎng),因?yàn)闆](méi)有時(shí)間去刪除,更何況是要挖掘出來(lái)大家以前沒(méi)有的,看不到的價(jià)值。第三以后要查詢數(shù)據(jù)時(shí)就要快速讀取,能不能把長(zhǎng)期存起來(lái)的數(shù)據(jù)迅速找到,拿到一個(gè)快速的數(shù)據(jù)層,使得實(shí)現(xiàn)數(shù)據(jù)挖掘的價(jià)值,從數(shù)據(jù)變成信息,從信息變成決策,影響未來(lái)的發(fā)展。
可見,存儲(chǔ)所面臨的問(wèn)題和挑戰(zhàn),首先是數(shù)據(jù)太多,其次難以管理。第三是運(yùn)營(yíng)支出。最后是資源鎖定利用率不高等。
在傳統(tǒng)的數(shù)據(jù)中心,大家看到了交易型的數(shù)據(jù)庫(kù),如何來(lái)解決這樣的問(wèn)題,通過(guò)網(wǎng)絡(luò)連到了一個(gè)存儲(chǔ),然后為了保證這個(gè)存儲(chǔ)的可用性,把數(shù)據(jù)備份,而后多數(shù)據(jù)中心做實(shí)時(shí)容災(zāi),這是非常經(jīng)典的存儲(chǔ)架構(gòu)。,但是對(duì)于數(shù)據(jù)的存儲(chǔ)方面,目前主流的四個(gè)需求已經(jīng)呈現(xiàn)出來(lái),第一個(gè)是重復(fù)數(shù)據(jù)刪除:比如每天大家生活中最常見的發(fā)郵件,大家會(huì)抄送給很多人,我們的郵件服務(wù)器上會(huì)有很多重復(fù)的郵件副本,這些數(shù)據(jù)也會(huì)占用大量空間第二:實(shí)時(shí)的壓縮:剛剛說(shuō)兩個(gè)數(shù)據(jù)中心以前產(chǎn)生一百兆的數(shù)據(jù),通過(guò)千兆和萬(wàn)兆傳出去,沒(méi)有問(wèn)題,如果你有5個(gè)TB的,你通過(guò)網(wǎng)上傳輸,還不如拿著硬盤坐飛機(jī)過(guò)去來(lái)得快,因?yàn)槭苤朴诰W(wǎng)絡(luò)帶寬?刹豢梢园褦(shù)據(jù)進(jìn)行壓縮后再傳過(guò)去,這也是一個(gè)解決的方式。
第三個(gè)是分層存儲(chǔ),大家談到了在一個(gè)存儲(chǔ)里面,這個(gè)數(shù)據(jù)是不是說(shuō)一開始并不是熱點(diǎn)的數(shù)據(jù),后來(lái)的由于某種需求變熱,而后變冷,存儲(chǔ)的介質(zhì)要求一定是不一樣的,如何按照需求來(lái)移動(dòng)冷熱數(shù)據(jù)到對(duì)應(yīng)的存儲(chǔ)層上這也是一個(gè)存儲(chǔ)的需求。,
第四:是自動(dòng)精簡(jiǎn)配置也將是存儲(chǔ)的需求之一。
所有這些存儲(chǔ)功能,都需要計(jì)算的能力,要想知道什么是重復(fù)的數(shù)據(jù),必須先要計(jì)算哪些塊是一樣的,你要想刪除的話,就要進(jìn)行大量的重復(fù)數(shù)據(jù)刪除,也要進(jìn)行計(jì)算,分層的存儲(chǔ)也要知道哪一些數(shù)據(jù)塊熱,什么時(shí)候熱,怎么樣遷移到對(duì)應(yīng)的層次上,這些都需要用計(jì)算來(lái)感知。,現(xiàn)在的存儲(chǔ)完全和以前不一樣了不僅僅是一個(gè)倉(cāng)庫(kù)需要更為智能,更為精細(xì)的管理員,需要管理的流程和方式,這都是需要運(yùn)用計(jì)算來(lái)實(shí)現(xiàn)的。
通過(guò)計(jì)算來(lái)實(shí)現(xiàn)的存儲(chǔ)看到可以達(dá)到什么樣的目的,數(shù)據(jù)壓縮可以節(jié)省80%的空間。數(shù)據(jù)重復(fù)刪除的備份量可以減少95%,數(shù)據(jù)的精簡(jiǎn)配置大家可以釋放40-60%的空間。通過(guò)計(jì)算能力的增強(qiáng),將大幅度提升存儲(chǔ)的有效性。
所以對(duì)于傳統(tǒng)的數(shù)據(jù)中心而言,不斷豐富存儲(chǔ)的功能是大家解決很多問(wèn)題的行之有效的方法,而這些方法基于存儲(chǔ)的計(jì)算的能力,基于CPU所提供的智能化的管理和存儲(chǔ)的能力。
那么,未來(lái)的數(shù)據(jù)中心如何,在未來(lái)的數(shù)據(jù)中心里面大家看到其實(shí)有不同的數(shù)據(jù),有一部分是實(shí)施業(yè)務(wù)的數(shù)據(jù)庫(kù)在運(yùn)行,還有一部分是長(zhǎng)期歸檔的海量數(shù)據(jù)。“舉一個(gè)簡(jiǎn)單的例子,國(guó)外的某一個(gè)數(shù)據(jù)中心,或者國(guó)內(nèi)的大網(wǎng)站,運(yùn)營(yíng)商,你走到他的數(shù)據(jù)中心里面,分不清哪些是存儲(chǔ),哪些是服務(wù)器,全部是標(biāo)準(zhǔn)的機(jī)架服務(wù)器,甚至是密度更高的服務(wù)器,壞了怎么辦,換下來(lái),拿走。換新的。整個(gè)的存儲(chǔ)服務(wù)都是靠軟件+標(biāo)準(zhǔn)化的硬件來(lái)提供服務(wù)的。”
這些服務(wù)器集群擁有超大的容量,大家可以看到達(dá)到百P甚至是上到EB的級(jí)別,所以在大數(shù)據(jù)的領(lǐng)域橫向擴(kuò)展的存儲(chǔ),也是未來(lái)的一個(gè)發(fā)展方向。過(guò)去大家都說(shuō)存儲(chǔ)是存儲(chǔ),服務(wù)器是服務(wù)器。到了今天希望通過(guò)融合的架構(gòu),標(biāo)準(zhǔn)的架構(gòu),既可以做存儲(chǔ),又可以做服務(wù)器,唯一的區(qū)別是應(yīng)用模式場(chǎng)景不同,大家采用的配置不同。對(duì)于性能需求大的,配置更高CPU更大的緩存,對(duì)于存儲(chǔ)需求較大的配置更大的硬盤等。
最終的目的,對(duì)各種應(yīng)用模式和場(chǎng)景提供經(jīng)濟(jì)的高效的擴(kuò)展平臺(tái)。
如果大家采用更多的計(jì)算能力,大家完全可以用智能化的存儲(chǔ),減少四十到五十的存儲(chǔ)空間,采用重復(fù)的數(shù)據(jù)刪除可以節(jié)省95%的備份數(shù)據(jù)。
目前英特爾不僅擁有存儲(chǔ)、網(wǎng)絡(luò)、計(jì)算、也擁有大數(shù)據(jù)分析,管理,安全等相應(yīng)的解決方案、涵蓋了大家在整個(gè)行業(yè)里面的方方面面。但是,因特爾的角色是跟大家一起來(lái)共建這個(gè)生態(tài)環(huán)境,和前端有硬件廠商,存儲(chǔ)廠商,軟件服務(wù)器,行業(yè)方案解決提供商,一起攜手將最好的,最優(yōu)勢(shì)的方案提供給客戶。這才最終是我們的價(jià)值所在。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.oesoe.com/
本文標(biāo)題:亢海峰:大數(shù)據(jù)時(shí)代的智能存儲(chǔ)
本文網(wǎng)址:http://www.oesoe.com/html/support/1112156613.html