一 引言
云計算作為當前業(yè)界的熱點,其主要功用之一是處理急劇增長的海量數(shù)據(jù)信息,而它之所以能夠做到這一點是因為其背后擁有著強大的云存儲技術(shù)的有效支持。類似于云計算,云存儲也是基于網(wǎng)絡(luò)的能夠高效可靠地按需為用戶提供存儲服務(wù)。云存儲與存儲虛擬化具有密不可分的關(guān)系。為了做到動態(tài)按需分配,云存儲需要在網(wǎng)絡(luò)中擁有充足的資源以位置透明的方式提供給用戶,這就需要依賴于存儲虛擬化技術(shù)屏蔽掉底層存儲硬件對上層應(yīng)用的影響,使得存儲資源能夠以一個“無窮無盡”的資源池的方式展現(xiàn)給用戶。
二 存儲虛擬化
存儲虛擬化的三種技術(shù)類型:基于網(wǎng)絡(luò)附加存儲(NAS)、存儲區(qū)域網(wǎng)絡(luò)(SAN)和Google文件系統(tǒng)(GFS)。
傳統(tǒng)的存儲虛擬化主要基于網(wǎng)絡(luò)附加存儲(Network Attached Storage,NAS)和存儲區(qū)域網(wǎng)絡(luò)(Storage Area Network,SAN)等存儲系統(tǒng)技術(shù),通過在物理存儲系統(tǒng)和服務(wù)器之間增加一個虛擬層,實現(xiàn)對分散的、不同品牌、不同級別的多個存儲系統(tǒng)的整合。NAS和SAN都是基于網(wǎng)絡(luò)為用戶提供存儲資源的技術(shù),但不同點在于NAS是采用文件系統(tǒng)管理硬件存儲資源,并通過網(wǎng)絡(luò)協(xié)議(例如NFS協(xié)議和CIFS協(xié)議)為用戶提供文件級的存儲訪問,它可以支持異構(gòu)客戶端的共享訪問;而SAN是采用專用的存儲網(wǎng)絡(luò)設(shè)備連接存儲資源硬件為用戶提供塊級的存儲訪問,對它的訪問需要依賴于客戶端文件系統(tǒng)。這兩種技術(shù)都使用專用的存儲設(shè)備作為底層硬件資源,但NAS采用網(wǎng)絡(luò)協(xié)議會降低傳輸過程中的有效載荷比從而性能不高,而SAN采用專用存儲網(wǎng)絡(luò)具有較高的傳輸性能但是價格較貴。另外,NAS中存儲的文件能夠被異構(gòu)客戶端共享訪問,而SAN卻很難做到這一點。
雖然基于NAS和SAN的存儲虛擬化方法得到了廠商的廣泛支持,在以往的存儲系統(tǒng)中多有應(yīng)用,但是面對云計算的海量、高可擴展、高可靠、高性能等存儲需求,這些傳統(tǒng)的存儲虛擬化技術(shù)普遍存在著缺陷。于是,一類以Google文件系統(tǒng)(Google File System,GFS)為代表的新興的以分布式文件系統(tǒng)為基礎(chǔ)的存儲技術(shù)引起了業(yè)界的關(guān)注,并已經(jīng)在云存儲領(lǐng)域取得了比較好的效果。
類GFS的存儲系統(tǒng)普遍采用主到從架構(gòu),由一個或幾個管理節(jié)點和多個分布的存儲節(jié)點組成。不同于基于專用存儲設(shè)備的傳統(tǒng)存儲技術(shù),系統(tǒng)中的節(jié)點采用了遵循統(tǒng)一標準的既具有計算能力又具有存儲能力的PC服務(wù)器。每個存儲節(jié)點利用自己的文件系統(tǒng)對本地存儲資源進行管理,再由管理節(jié)點通過部署在各個節(jié)點上的分布式文件系統(tǒng)為系統(tǒng)中所有的存儲資源提供統(tǒng)一的文件名字空間,構(gòu)成虛擬的存儲資源池,因此這類系統(tǒng)具有良好的可擴展性,能夠應(yīng)對海量數(shù)據(jù)的存儲和管理。同時也具有較低的價格。在系統(tǒng)中,數(shù)據(jù)的存取以文件為單位,每個文件被采用分塊的方式保存并且存有多個副本。因此,同一文件的多個數(shù)據(jù)塊可以分布在不同的存儲節(jié)點上,這使得隸屬于同一文件的多個數(shù)據(jù)塊可以被并行地存取,具有較高的吞吐性能。另外,文件數(shù)據(jù)塊副本的分布式存儲提高了文件訪問的可靠性,避免了某個節(jié)點出現(xiàn)故障對文件正常存取的影響。同時,當某個存儲節(jié)點出現(xiàn)問題時,管理節(jié)點會及時發(fā)現(xiàn)并將故障節(jié)點中的數(shù)據(jù)重新分布到其它正常節(jié)點中,保證節(jié)點級的可靠性。
與傳統(tǒng)的存儲虛擬化比較,類GFS的基于分布式文件系統(tǒng)的存儲虛擬化技術(shù)能夠更好地滿足云計算的需求,在業(yè)界有著非常廣闊的應(yīng)用前景。但是這類系統(tǒng)也具有局限性,例如不適合實時要求高的隨機數(shù)據(jù)訪問、管理節(jié)點容易成為系統(tǒng)瓶頸、缺少POSIX兼容接口增加應(yīng)用難度等等。
三 云存儲服務(wù)的三種模式
存儲虛擬化是云存儲的基礎(chǔ),但是云存儲并不僅僅是一個技術(shù)名詞,它更代表了新興的服務(wù)理念和運營思路。類似于云計算的基礎(chǔ)設(shè)施即服務(wù)(IaaS)、平臺即服務(wù)(PaaS)、軟件即服務(wù)(SaaS)三類服務(wù)模型,云存儲服務(wù)的模型也可以被細分為存儲資源即服務(wù)(Storage as a Service)、數(shù)據(jù)即服務(wù)(Data as a Service)、信息即服務(wù)(Information as a Service)等三類服務(wù)。在不同的服務(wù)中采用合適的存儲虛擬化技術(shù)作支撐,往往可以獲得事半功倍的效果。
存儲資源即服務(wù)是為用戶提供存儲空間的服務(wù)。當用戶提出存儲空間請求時,云存儲系統(tǒng)會在存儲資源池中劃分出用戶所需的空間供其進行相關(guān)的存儲應(yīng)用開發(fā),這一點類似于云計算的IaaS服務(wù)。存儲資源即服務(wù)將底層硬件存儲資源進行整合,構(gòu)建出統(tǒng)一的資源視圖,然后按需分配給用戶使用,并做到動態(tài)彈性縮放,能夠有效地提高存儲資源利用率,降低用戶的存儲設(shè)備投資和管理成本。存儲資源即服務(wù)是存儲虛擬化技術(shù)的設(shè)計目標之一。因此無論是傳統(tǒng)的存儲虛擬化技術(shù)還是新興的類GFS虛擬化技術(shù)均能較好地滿足功能需求,特別是類GFS虛擬化技術(shù)因為其采用的存儲設(shè)備具有統(tǒng)一的標準,因此可以具有更優(yōu)的擴展性。另外,在功能需求被滿足的前提下,不同存儲系統(tǒng)技術(shù)在成本和性能上會有些許差異。
數(shù)據(jù)即服務(wù)是為用戶提供計算數(shù)據(jù)的服務(wù)。與存儲資源即服務(wù)不同,它提供的服務(wù)是存儲的內(nèi)容而并非存儲空間本身。根據(jù)用戶的需求,數(shù)據(jù)即服務(wù)及時地將計算所需的數(shù)據(jù)提供給計算單元,達到數(shù)據(jù)存儲為計算服務(wù)的目的,這一點類似于云計算的PaaS服務(wù)。對于這類服務(wù),類GFS虛擬化技術(shù)具有更優(yōu)的效能,這是因為這類系統(tǒng)中的存儲節(jié)點和計算節(jié)點往往復(fù)用同一節(jié)點(例如Google的GFS文件系統(tǒng)和MapReduce計算模型),有效地減少了計算過程中的數(shù)據(jù)傳輸。而在傳統(tǒng)的存儲虛擬化系統(tǒng)中,需要額外的通道將虛擬化存儲中的數(shù)據(jù)傳輸?shù)接嬎銌卧校哂休^高的延遲。但是類GFS虛擬化技術(shù)具有一定的局限性,它要求計算過程能夠并行化,計算步驟可以散布到存儲節(jié)點上,因此它并非適用于所有應(yīng)用場合。
信息即服務(wù)是為用戶提供應(yīng)用信息的服務(wù)。與數(shù)據(jù)即服務(wù)不同,它提供的服務(wù)是數(shù)據(jù)經(jīng)過處理后的能夠直接交付給用戶直接應(yīng)用的信息,這一點類似于云計算的SaaS服務(wù)。提供這類服務(wù),除了前文提及的信息存儲過程外,更重要的是服務(wù)提供方式,最常見的就是為用戶提供信息查詢。對于存儲系統(tǒng)而言,高效的查詢過程的實現(xiàn)需要借助數(shù)據(jù)庫系統(tǒng),因此無論是傳統(tǒng)的存儲虛擬化技術(shù)還是新型的類GFS虛擬化技術(shù),對數(shù)據(jù)庫的支持將非常重要。在這一點上,天生依賴于文件系統(tǒng)的存儲系統(tǒng)(例如NAS存儲系統(tǒng)和類GFS系統(tǒng))因為其數(shù)據(jù)庫應(yīng)用必須構(gòu)建于文件系統(tǒng)之上從而會導(dǎo)致額外的開銷,而那些能夠直接對塊存儲設(shè)備直接操作的系統(tǒng)(例如SAN系統(tǒng))則具有一定的性能優(yōu)勢。
綜上所述,存儲虛擬化技術(shù)類型與云存儲服務(wù)方模式也在不斷地發(fā)展嚴禁之中。云存儲核心技術(shù)的選擇必須建立在針對實際業(yè)務(wù)需求的全面評估的基礎(chǔ)之上,切不可盲目跟風,否則不但會使得云存儲的效果事倍功半,還會進一步引起云計算相關(guān)領(lǐng)域的連鎖不良反應(yīng)。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.oesoe.com/
本文標題:海量信息的存儲和使用
本文網(wǎng)址:http://www.oesoe.com/html/consultation/1083974482.html