隨著近兩年云計算概念被炒得熱火朝天,存儲也被戴了頂“云”帽子。不但EMC、HDS、IBM、NetApp這些存儲巨頭們帶頭搖旗吶喊,推出了各自的云存儲解決方案,其他很多互聯(lián)網(wǎng)公司、軟件企業(yè)、電信設(shè)備供應(yīng)商等大型企業(yè)也紛紛加入,推出自己的云戰(zhàn)略。一時間,公有云、私有云等各種云產(chǎn)品、云方案,連篇累牘地刺激著觀眾的眼球。在這股“云”浪潮的推動下,涌現(xiàn)出一批具有獨特商業(yè)模式的公司,如國內(nèi)的金山推出了快盤服務(wù),華為也宣布組建云計算產(chǎn)品線。國內(nèi)一些在存儲領(lǐng)域默默耕耘的技術(shù)型公司逐漸暫露頭角,如中科藍(lán)鯨的藍(lán)鯨集群文件系統(tǒng)就贏得了同行的認(rèn)可,獲得了多個OEM訂單,正在一步步從幕后走向前臺。
然而,云存儲一般作為存儲服務(wù)而存在,而那些在底層支撐的傳統(tǒng)的存儲技術(shù)如磁盤、磁盤陣列技術(shù)也在悄然的進(jìn)化中,不但繼續(xù)服務(wù)于傳統(tǒng)數(shù)據(jù)存儲應(yīng)用,瓜分仍在以兩位數(shù)增長的外部存儲市場,也為云計算和云存儲提供了物質(zhì)保證和最基礎(chǔ)的支撐,本文將對此就做一個簡單的介紹。
一、硬盤技術(shù)
自從1956年被IBM發(fā)明至今,傳統(tǒng)的機(jī)械硬盤(又稱溫徹斯特硬盤、溫盤)技術(shù)的發(fā)展從沒有間斷過——磁盤面密度不斷加大、性能不斷提高、體積不斷縮小,但其結(jié)構(gòu)上并沒有發(fā)生本質(zhì)的變化。但這種情況在SSD的出現(xiàn)后發(fā)生了轉(zhuǎn)機(jī)。
SSD,又稱為固態(tài)硬盤。由于沒有了傳統(tǒng)硬盤的機(jī)械讀寫裝置,固態(tài)硬盤的隨機(jī)讀寫性能大幅度改善,一塊普通SSD的小粒度IOPS可以輕松達(dá)到上萬,對比機(jī)械硬盤的幾乎是成數(shù)量級的提升,一塊磁盤的IOPS甚至可達(dá)到過去一個磁盤陣列的,在大量讀操作的場景下SSD磁盤體現(xiàn)得更為明顯。SSD磁盤和傳統(tǒng)HDD磁盤相比還具有性能、環(huán)保、防振等優(yōu)勢。
但SSD也有它的問題,和機(jī)械硬盤相比其故障模型上存在很大的不同。機(jī)械硬盤故障有兩種:一種是突然失效,這和使用時間有關(guān),具有較大的時間離散性;另一種是出現(xiàn)壞扇區(qū),也稱壞塊,這種故障具有時間和空間的雙重局部性,而且和讀寫次數(shù)幾乎不相關(guān)。而SSD的失效模型則根本不同,幾乎只和寫入的數(shù)據(jù)量相關(guān)。由于其存儲單元的擦寫壽命只有1萬次(MLC)~10萬次(SLC),SSD硬盤開發(fā)商們開發(fā)了如“磨損平衡”、“失效空間預(yù)留”等各種技術(shù)來盡可能延長SSD的使用壽命,雖然效果很明顯,但仍然無法避免理論上的失效問題,尤其是采用多塊相同型號SSD硬盤組成的磁盤陣列在寫入一定量的數(shù)據(jù)后會存在固態(tài)盤集體失效的風(fēng)險,這一點對于很多關(guān)鍵應(yīng)用來講是致命的。
二、存儲接口技術(shù)
IDE接口和SCSI接口分別誕生于1986年和1987年,分別定位于桌面和服務(wù)器市場,在SATA接口和SAS接口出現(xiàn)之前各自統(tǒng)治桌面和服務(wù)器硬盤市場20年。1997年出現(xiàn)的光纖通道(Fibre Channel,F(xiàn)C)技術(shù)則第一次把存儲推上了一個新的高度,存儲系統(tǒng)成為獨立的系統(tǒng)而不再是服務(wù)器系統(tǒng)的“附件”。
FC一面世便帶著其貴族般的特征:雙端口硬盤支持高可用,串行通訊接口支持?jǐn)?shù)據(jù)包交換,光纖傳輸提供高帶寬傳輸,并支持磁盤熱插拔、連接設(shè)備數(shù)量大、遠(yuǎn)程連接且連接可靠等先進(jìn)功能,一經(jīng)推出便牢牢占據(jù)了高端磁盤陣列的市場。曾經(jīng)廣泛應(yīng)用于中、高端磁盤陣列當(dāng)中,但這種情況在SAS接口出現(xiàn)后逐漸發(fā)生了轉(zhuǎn)變。
SAS接口規(guī)范具備FC規(guī)范的雙端口、串行數(shù)據(jù)通訊、多設(shè)備支持等優(yōu)秀特性,迅速獲得了廣泛采用,發(fā)展非常迅速,接口速度方面迅速進(jìn)化到6Gbps,已經(jīng)超過其前輩FC的4Gb,并且很快向下一代12Gbps邁進(jìn)。值得注意的是,似乎硬盤廠商已經(jīng)逐漸放棄了FC接口磁盤的升級,盡管市場上8Gb的FC接口的磁盤陣列已經(jīng)大面積普及,但其內(nèi)部FC磁盤接口的速度仍然停留在4Gbps,并沒有跟隨新的標(biāo)準(zhǔn)進(jìn)步,各硬盤廠商更沒有明確的路線圖。
一般來講,目前大于等于10000轉(zhuǎn)以上的磁盤多采用6Gb SAS(Serial Attached SCSI)或4Gb FC(Fibre Channel)接口。低于10000轉(zhuǎn)的磁盤一般采用SATA接口。而最近出現(xiàn)的一個新接口磁盤——NL-SAS,NL-SAS是在原有的企業(yè)級SATA硬盤的盤體上裝備了標(biāo)準(zhǔn)的SAS接口,使其不但具備了SAS硬盤的所有功能,提高了磁盤陣列的可靠性,而且容量更大,功耗也更低,適用于在一個此盤陣列系統(tǒng)中實現(xiàn)分級存儲,并簡化了磁盤陣列系統(tǒng)的設(shè)計。
一般來講,從性能角度來區(qū)分,SSD由于其革命性的技術(shù)提供了最優(yōu)的性能,而FC和SAS硬盤擁有同樣高的旋轉(zhuǎn)速度也有不錯的性能表現(xiàn),NL-SAS盤和SATA盤則為了兼顧成本、容量和功耗等因素在性能方面做了較大的妥協(xié)。
在磁盤接口方面,由于技術(shù)更新較快,新一代的SAS甚至SATA都可以提供6Gb/s的帶寬,而FC仍固守4Gb/s,已經(jīng)感到明顯落后。而磁盤陣列的外部接口則仍然以FC為主,雖然SAS接口的高性能令人矚目,但其外部電纜最大長度只能達(dá)到8米遠(yuǎn),無法進(jìn)行遠(yuǎn)距離傳輸,也就無法滿足異地容災(zāi)的需求,在中高端此盤陣列當(dāng)中很少被采用。另外新近流行起來的兩個接口都是基于以太網(wǎng)為載體的,一個是iSCSI接口,另一個是FCoE,兩者各有優(yōu)缺點。一般認(rèn)為,F(xiàn)CoE比較適合于已經(jīng)有了FC基礎(chǔ)設(shè)施和對任務(wù)關(guān)鍵型有要求的場合,更加符合FC當(dāng)前所處的生態(tài)環(huán)境中;而iSCSI則適用于對性能不敏感的應(yīng)用,更像是網(wǎng)絡(luò)環(huán)境中的一個分子。
從長遠(yuǎn)來講,SSD磁盤乃是大勢所趨,各家存儲系統(tǒng)供應(yīng)商也都有固態(tài)磁盤陣列提供,在一些對隨機(jī)性能要求苛刻的應(yīng)用當(dāng)中的確發(fā)揮得很出色。但就目前來說基于SSD的磁盤陣列仍然處于起步階段,并沒有經(jīng)過長時間的實際應(yīng)用的考驗,對于那些對業(yè)務(wù)連續(xù)性要求遠(yuǎn)高于性能要求的業(yè)務(wù),在磁盤陣列中使用SSD硬盤還須多分謹(jǐn)慎。
三、RAID及磁盤陣列體系架構(gòu)
最初的磁盤都是單體使用,為了獲得大的容量必須把磁盤體積做得很大,比如1956年IBM發(fā)明的第一個硬盤RAMAC雖然只有5MB,但體積有兩個冰箱大,1973年的IBM 3340硬盤由于技術(shù)進(jìn)步使容量達(dá)到60MB,體積卻縮小到家用洗衣機(jī)大小。以后的趨勢也是沿著容量增大、體積縮小發(fā)展,但問題仍然很明顯:想獲得更大的容量非常困難,或者造價高昂;硬盤故障造成業(yè)務(wù)停頓甚至是數(shù)據(jù)丟失。1987年,美國加州大學(xué)伯克利分校提出了RAID(Redundant Array of Inexpensive Disk)技術(shù),有了RAID技術(shù),許多小容量磁盤,通過采用不同級別的RAID就可以實現(xiàn)更高的可靠性及讀寫性能,于是現(xiàn)代概念的磁盤陣列就誕生了。
在《光纖磁盤陣列技術(shù)簡析》一文中把磁盤陣列劃分為JBOD、雙控制器、多控制器三種。如今JBOD已基本不見蹤跡,取而代之的是單控制器架構(gòu)。而隨著技術(shù)的不斷進(jìn)步和市場的進(jìn)一步拉動,今天磁盤陣列在現(xiàn)有的單控制器架構(gòu)、雙控制器架構(gòu)及多控制器架構(gòu)基礎(chǔ)上又演化出三類新型多控制器磁盤陣列,分別為單控松耦合集群架構(gòu)、雙控松耦合集群架構(gòu)及多控緊耦合集群架構(gòu)。
單控制器架構(gòu)就是通過將服務(wù)器與JBOD相結(jié)合,整體作為一個存儲系統(tǒng)提供存儲服務(wù)。比如,NETAPP單控的 Filer、一些國內(nèi)廠家的單控盤陣等。單控制器架構(gòu)因為結(jié)構(gòu)簡單、成本低廉而廣泛應(yīng)用于對業(yè)務(wù)連續(xù)性要求不高的低端應(yīng)用,或者作為單控松耦合集群架構(gòu)的基本單元而發(fā)揮作用,比如IBM的XIV、被EMC收購的ISILON等系統(tǒng),就是由這種基本單元構(gòu)成新型單控松耦合集群架構(gòu)。
雙控制器架構(gòu)的兩個控制器之間冗余設(shè)計,消除了單點故障。市場上大部分中低端磁盤陣列都是這樣的體系架構(gòu)。由于面向中低端市場,同時支持FC-SAN、IP-SAN及NAS訪問協(xié)議的一體化磁盤陣列,因為功能多樣、成本較低、簡單易用而較受歡迎,NETAPP、EMC等專業(yè)存儲廠商都推出了這樣一體化存儲系統(tǒng)。
多控制器架構(gòu)不再局限于兩個控制器,可以根據(jù)業(yè)務(wù)需求配置更多控制器協(xié)同工作,實現(xiàn)容量擴(kuò)充的同時性能也得以同步擴(kuò)充。傳統(tǒng)多控制器架構(gòu)是三層架構(gòu),即在前端控制器、后端控制器、中間CACHE緩存之間實現(xiàn)分工協(xié)作。EMC的SYMMETRIX DMX系列產(chǎn)品、HDS的USP系列產(chǎn)品都屬于典型的傳統(tǒng)多控制器架構(gòu)。
新型多控制器磁盤陣列是近年存儲市場出現(xiàn)的新動向,從體系架構(gòu)角度看,新型多控制器架構(gòu)均由上述三種基本架構(gòu)演化而來,這也符合技術(shù)發(fā)展的持續(xù)性和繼承性。
首先,單控制器架構(gòu)處理能力有限,同時單一節(jié)點又缺乏可靠性設(shè)計,人們難以接受單一單控制器架構(gòu)磁盤陣列。因此一般都是將單控制器架構(gòu)作為基本單元,再通過以太網(wǎng)、IB(InfiniBand)等外部通用標(biāo)準(zhǔn)通信協(xié)議,實現(xiàn)多個單控制器架構(gòu)之間的松散互連,形成一個整體的數(shù)據(jù)存儲系統(tǒng),姑且稱之為單控松耦合集群架構(gòu)。這類架構(gòu)典型產(chǎn)品包括塊級接口的XIV、文件級接口的Panasas、Isilon、IBRIX等,這些存儲系統(tǒng)一般面向相對獨特的非結(jié)構(gòu)化類應(yīng)用需求。
雙控制器架構(gòu)也走向了集群化,既所謂的雙控松耦合集群架構(gòu)。這類雙控松耦合集群架構(gòu)的各個雙控節(jié)點之間一般都采用非全交換式的專網(wǎng)實現(xiàn)連接。EMC的VMAX通過RapidIO技術(shù)互連;HP的3PAR系列通過專用背板互連; FUJISU的8000系列通過PCI-E路由互連。這些系統(tǒng)共同問題是,首先整個系統(tǒng)架構(gòu)存在互連帶寬瓶頸;其次跨節(jié)點訪問存在延遲不一致性。第三由于體系結(jié)構(gòu)改動較大,某些應(yīng)用在實際生產(chǎn)環(huán)境中的性能表現(xiàn)和基準(zhǔn)測試的標(biāo)稱值會存在較大差異。
最后,傳統(tǒng)多控制器架構(gòu)也開始了橫向擴(kuò)展,這便是新型多控緊耦合集群架構(gòu)。由于傳統(tǒng)多控制器架構(gòu)單一節(jié)點非常龐大,實現(xiàn)這些大節(jié)點的通信必須采用高帶寬、緊耦合的互連為基礎(chǔ)。目前新型多控緊耦合集群架構(gòu)只有HDS的VSP一個產(chǎn)品,HP公司的P9500作為VSP的OEM產(chǎn)品,也是這樣的體系架構(gòu)。EMC的SYMMTRIX 在DMX-4之后似乎停止了傳統(tǒng)三層多控制器架構(gòu)的探索。EMC的新型多控制器架構(gòu)產(chǎn)品轉(zhuǎn)向了前文提及的VMAX,它和傳統(tǒng)的三層架構(gòu)的多控制器產(chǎn)品SYMMTRIX在體系架構(gòu)上大相徑庭。
VSP的一個基本單元就是一個傳統(tǒng)多控制器架構(gòu),繼續(xù)保持前端控制器、后端控制器及中間高速緩存這樣的三層架構(gòu),單一節(jié)點的規(guī)模和上代產(chǎn)品不相上下,因此單一節(jié)點具備傳統(tǒng)多控制器架構(gòu)的性能及可靠性。在此基礎(chǔ)上,VSP上還增加了一新的VSD核心處理器單元,負(fù)責(zé)跨節(jié)點通信及功能軟件。由于VSP繼續(xù)采用了基于CROSSBAR的全交換架構(gòu),在多個節(jié)點之間,通過系統(tǒng)內(nèi)部交換架構(gòu)實現(xiàn)集群,集群后的存儲仍是一個整體,即存儲跨節(jié)點之間的訪問延遲是一致的,這確保了實際使用環(huán)境中的穩(wěn)定性能,避免松散耦合架構(gòu)導(dǎo)致的性能不確定性。
筆者認(rèn)為,對于性能和可靠性要求較高的應(yīng)用來說,多控制器緊耦合集群架構(gòu)的磁盤陣列訪存很直接不需要某些轉(zhuǎn)發(fā),從理論上講應(yīng)該占些優(yōu)勢。這類磁盤陣列在可靠性和性能方面繼承了傳統(tǒng)多控制器架構(gòu)。
而采用松散耦合的單控或雙控集群架構(gòu),雖然提供優(yōu)秀的多方面擴(kuò)展能力和極低的成本,但在訪問延遲等性能方面以及系統(tǒng)部件可靠性上均差距較大,并不適合于延遲敏感的事務(wù)密集型應(yīng)用。
當(dāng)然多控制器緊耦合集群架構(gòu)的最大劣勢在于其成本相對較高,如何應(yīng)對眾多新型多控制器架構(gòu)的價格戰(zhàn),成為該類存儲系統(tǒng)生存發(fā)展的關(guān)鍵。
隨著技術(shù)的不斷發(fā)展和應(yīng)用模式的不斷演化,一些破壞性的創(chuàng)新技術(shù)也會不斷涌現(xiàn)和完善,說不定未來有一天,松耦合的集群架構(gòu)將逐漸占據(jù)更大存儲市場份額,就像今天的集群服務(wù)器一樣占領(lǐng)部分高端服務(wù)器市場。但即便如此,大型機(jī)及小型機(jī)仍然有其生存和發(fā)展空間,起著不可替代的作用,仍然是喜歡它們的老客戶之最愛。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.oesoe.com/
本文標(biāo)題:磁盤陣列技術(shù)的新進(jìn)展
本文網(wǎng)址:http://www.oesoe.com/html/consultation/1083964630.html