信息技術的迅猛發(fā)展使得數(shù)據存儲量呈爆炸式增長,數(shù)據量的激增又導致數(shù)據中心的規(guī)模不斷擴大,能耗成本日益突出。據美國EPA(Environmental Protection Agency)的報告指出:2006 年美國數(shù)據中心消耗6.10×109 kW·h 電力,這相當于580 萬中等家庭的耗電量。此外在一個IT公司中,數(shù)據中心的年能源消耗成本已成為繼人力成本后的第二大成本支出,而且在隨后的幾年里將會持續(xù)增加。高能耗不僅帶來運營成本的增加,而且容易引起設備故障。最新結果表明,約50%的設備故障和環(huán)境過熱有關。每當溫度上升15 ℃,則磁盤的故障率提高一倍。因此Google公司的首席執(zhí)行官EricSchmidt 就曾表示:“最影響Google 設計人員的不是計算機系統(tǒng)速度而是能耗,因為一個數(shù)據中心能消耗一座城市的電力”。
如何做到即降低能耗,節(jié)省成本,又能滿足實際性能的需要已經成為迫切需要解決的難題,由此引入綠色存儲的概念。綠色存儲的最終目的是利用最少的存儲容量來滿足業(yè)務的需求,從而消耗最低的能源。
1.技術分類
近年來,存儲能耗問題已經引起人們的廣泛關注,國內外的不少團隊開始對其進行研究,并取得了豐碩成果。然而目前國內尚未有人對其進行系統(tǒng)總結,因此本文從宏觀和微觀兩個角度對綠色存儲技術的發(fā)展現(xiàn)狀進行了系統(tǒng)分析。
1.1 宏觀方面
(1)存儲虛擬化
以往數(shù)據中心的每臺服務器都有自己專屬的存儲空間,服務器之間很難“借用”存儲空間,造成不同設備的個體利用率差別很大而總體利用率偏低。虛擬化技術就是將實際的物理存儲實體和存儲的邏輯表示分離開,將不同設備的存儲資源整合到一個統(tǒng)一的虛擬化“存儲池”中,通過整合分散的存儲空間來解決容量和管理方面的制約。
(2)重復數(shù)據刪除
重復數(shù)據刪除技術是一種數(shù)據縮減技術,消除分布在存儲系統(tǒng)中相同文件或數(shù)據塊,保留惟一的數(shù)據實例。利用重復數(shù)據刪除技術可以減少對存儲空間和網絡帶寬的占用,使硬盤存儲成為可能。
(3)自動精簡配置
傳統(tǒng)的存儲系統(tǒng)中,當某用戶、某應用需要存儲空間時,需要事先預留足夠大的存儲空間以分配給該用戶或該應用,其他用戶或應用無法使用這些已經分配但尚未使用的存儲空間,這將導致閑置空間不斷增大。因此實際上,往往采用自動精簡配置來進行容量分配。自動精簡配置則可以根據某項應用的實際需要,動態(tài)并且實時地改變存儲容量資源的劃分,因此能更加充分有效地利用存儲資源,節(jié)約總成本。
(4)MAID
MAID(大規(guī)模非活動磁盤陣列存儲)最初的理論依據來自“80/20”定律,具體來說就是80%的訪問活動圍繞著20%的物理存儲進行。因此,那些暫時沒有數(shù)據被訪問的磁盤驅動器,完全可以進入能耗相對較低的待機狀態(tài),甚至完全關閉,需要訪問時再“喚醒”也來得及,從而達到節(jié)能的效果。
(5)分級存儲
數(shù)據分級存儲,是指利用存儲設備的性能差異(磁盤、磁盤陣列、光盤庫、磁帶庫),將不同的數(shù)據存放在不同的存儲設備中。通常是根據數(shù)據的重要性、訪問頻率、性能、容量、保留時間等因素確定的最佳存儲策略,通過分級存儲管理軟件實現(xiàn)數(shù)據客體在存儲設備之間的自動遷移。一般方法就是將不經常訪問的數(shù)據遷移到存儲性能較低的層次(如磁帶),節(jié)省出性能較高的存儲空間(如磁盤陣列,磁盤)存放被頻繁訪問的數(shù)據,以達到更好的系統(tǒng)性能。
1.2 微觀方面
(1)細分磁盤活動狀態(tài)
基于低轉速消耗低能量的理論,將磁盤盤片轉速劃分為多個速度等級,在系統(tǒng)負載較輕時使磁盤運轉在低速旋轉狀態(tài);而當系統(tǒng)負載變重時,將磁盤相應的調整到高速旋轉狀態(tài)。
缺陷:實現(xiàn)困難,僅有少數(shù)廠家能實現(xiàn)兩級轉速。
(2)減少磁頭定位開銷
磁盤的性能和能耗越來越受到磁頭定位延遲的限制,例如尋道時間和查找時間,讓磁盤盡可能地進行順序訪問是減少磁頭定位開銷的最有效方法,Huang等人為數(shù)據創(chuàng)建多個副本并將其存儲在文件系統(tǒng)的空閑塊上,通過I/O調度的方法使用戶請求盡可能地順序訪問磁盤上的數(shù)據。
缺陷:未考慮冗余。
(3)延長磁盤處于空閑狀態(tài)的周期
節(jié)省能耗的最常見的方法是當磁盤沒有請求時,讓磁盤處于等待狀態(tài)。然而服務器端面臨的請求太多,導致磁盤的平均空閑時間非常短無法滿足磁盤停止、啟動
的時間需求。所以目的就是人為地提升磁盤的空閑時間,同時又不影響系統(tǒng)系能。
提高磁盤處于空閑狀態(tài)周期的因素有以下幾部分:
①cache命中率
cache管理策略能產生不同的磁盤請求序列,這將嚴重影響磁盤的耗能。比如說一個讀請求所要的數(shù)據塊在cache中命中,它就不需要再去訪問磁盤,可以延長磁盤的空閑時間。
②數(shù)據流特征
讀/寫請求一起到來可能導致磁盤有較長的空閑期,如果讀/寫請求在時間上是均勻到來,則可能因為空
間隔太小而不能將磁盤轉到低功耗模式。對于多磁盤,多個連續(xù)讀/寫請求指向一簇磁盤節(jié)省的能耗要比分散指向所有磁盤節(jié)省的能耗多。
不同的磁盤有不同的數(shù)據流特征,例如請求到來的時間分布,冷未命中的數(shù)量,平均請求時間間隔等。這些數(shù)據流特征又對磁盤的能耗有著較大的影響。因為人們無法知道下一時刻數(shù)據流的到來情況,先前對數(shù)據流特征的研究主要是從兩個角度出發(fā):
預測:eRAID根據前一時刻和當前數(shù)據流狀態(tài),利用ARMA等模型預測未來工作流的可能變化。缺點是可靠性不高。
動態(tài)變化:根據數(shù)據流到來的狀態(tài),動態(tài)調整某些參數(shù),降低能耗。文獻給出了基于能耗感知的cache管理策略PA?LRU和PB?LRU。
③磁盤的冗余信息
利用磁盤間的冗余信息能夠將對一個非活躍磁盤的非阻塞讀平等的轉移成對其他活躍磁盤的讀請求(請求重定向)。
eRAID 利用RAID1的冗余特性來重定向I/O 請求,通過停止部分或整個冗余組來降低能耗,同時將系統(tǒng)性能的降低控制在一個可控的范圍內;當鏡像磁盤處于等待狀態(tài),讀請求由主磁盤來完成,寫請求由控制緩存或活躍磁盤來延遲,當鏡像磁盤啟動時再更新到鏡像磁盤里。
(4)數(shù)據布局
根據數(shù)據訪問方式的改變在磁盤間遷移數(shù)據,典型的代表就是PDC。PDC 模型根據數(shù)據訪問頻率的差異性,周期性地將熱點數(shù)據遷移到部分磁盤上,并將訪
問頻率較低的數(shù)據集中于剩下的磁盤中。但是由于PDC將大多數(shù)請求都集中到了一小部分磁盤上,這樣就容易形成系統(tǒng)瓶頸,增大系統(tǒng)響應延遲。
(5)存儲介質的改變
隨著存儲介質的發(fā)展,新型存儲介質日益受到人們的關注,其中的典型應用就是固態(tài)盤。固態(tài)盤由控制單元和FLASH芯片組成,沒有可移動的機械部件(如磁頭臂尋道,盤片旋轉),因此在性能和能耗方面有著明顯優(yōu)勢,但是在小文件寫入,使用壽命,性價比方面還有缺陷。
2.磁盤能耗的測量
通過對現(xiàn)有論文分析,對磁盤能耗的測試和優(yōu)化可以在已有磁盤能耗模型(2-參數(shù)模型,3-參數(shù)模型,粗糙-dempsey模型,dempsey模型)的基礎上利用磁盤仿真器disksim得到,已有磁盤能耗主要牽扯到兩方面的參數(shù),平均功率參數(shù)和時間參數(shù),平均功率參數(shù)可以通過磁盤規(guī)格得到,屬于已知內容,需要求的是時間參數(shù),時間參數(shù)主要是靠disksim得到。
對于磁盤能耗的建;蛘呦到y(tǒng)的整體能耗建模一般是兩種方法:仿真或者黑盒建模,為了驗證模型的正確性,需要真實的測量結果進行校驗。
3.結語
隨著信息技術的迅猛發(fā)展,數(shù)字信息呈爆炸式增長,數(shù)據中心的規(guī)模不斷擴大,能耗成本日益突出。由此引入以提高所有網絡存儲技術的能源效率為最終目的的綠色存儲的概念,并從宏觀和微觀兩個方面,對綠色存儲技術進行了分析。綠色存儲技術的發(fā)展不僅是IT產品供應商的責任,也是終端用戶的責任,每一個用戶必須意識到自己既是綠色存儲技術發(fā)展的驅動者又是綠色存儲技術發(fā)展的實踐者,有責任有義務為節(jié)能減排保護環(huán)境做貢獻?梢灶A見隨著終端用戶對綠色存儲的需求不斷提高,未來會有更多的綠色存儲產品和解決方案面世。
核心關注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務領域、行業(yè)應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業(yè)務領域的管理,全面涵蓋了企業(yè)關注ERP管理系統(tǒng)的核心領域,是眾多中小企業(yè)信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.oesoe.com/
本文標題:綠色存儲技術探析