引言
目前,信息建設的一個核心是云計算,在存儲領域中,則會涉及一個最常見和最重要的企業(yè)應用—云存儲。當企業(yè)發(fā)展到一定規(guī)模后,對于高可靠性存儲管理將具有更加迫切的要求,既要求存儲的容量能夠隨著企業(yè)應用的擴展逐年按需增長,又要求對不斷增長的數(shù)據進行完全可靠的備份和便捷管理。云存儲是目前最能夠適應這一需求的方式,但公有云的特性導致很多企業(yè),特別是對數(shù)據相對敏感的企業(yè),對于云存儲的應用是否適用企業(yè)存在疑慮。相應地,私有云為此提供了企業(yè)自掌控的選擇項。但私有云的搭建又成為企業(yè)面臨的又一道難題。
本研究通過云存儲模式建設實踐過程中獲得的經驗來說明私有云存儲的技術原理,并通過統(tǒng)一管理、高可用性等具體云存儲技術的實現(xiàn)原理來說明存儲網關如何支撐企業(yè)的私有云存儲需求。
事實上,本研究將私有云存儲的構建限定在了網絡存儲的框架范圍內,原因不僅因為網絡存儲是目前主流的存儲選項,而且還因為基于網絡存儲的私有云模式的建設是目前最為可行、也是最易實現(xiàn)的體系結構。其原理相對簡潔明了,對存儲的各項管理需求能夠比較充分地予以考慮并實現(xiàn),還可以避免一些復雜的存儲環(huán)節(jié)影響企業(yè)云存儲的建設。因此,對于涉及多種存儲設備的企業(yè)或單位而言,本研究給的建議是將其中網絡存儲的部分從原有存儲系統(tǒng)中剝離出來搭建基于網絡存儲的私有云體系,而其余的存儲暫時不納入這一體系,直到基于網絡存儲的限制被取消或者被替代。畢竟,云存儲體系最大的特點是逐步擴展,這不僅適用于容量的擴展要求,同樣也適用于技術的發(fā)展要求。
因此,本研究所提的云存儲體系可以被視為私有云存儲模式構建的第一階段,隨著技術的發(fā)展,該私有云將具備更大的適用面,并能夠包括更多的存儲設備和存儲模式。而其存儲管理的原理上卻不需要作任何的調整,只需要有更強的設備兼容性。
1 基于網絡存儲的私有云構建原理
目前,企業(yè)的存儲管理大致可以按存儲擴展方式分為兩大類,一類是堅持大存儲管理,一類是小存儲擴展管理。前者通常是一次性購置若干大型存儲設備,可以保證支撐企業(yè)3~5年的存儲需要,每隔3~5年重新確定方案升級現(xiàn)有的存儲模式,進行大規(guī)模的數(shù)據遷移。后者則采用逐年小存儲擴展的模式來進行,每年根據需要購置少量存儲用于替代或者擴充企業(yè)的存儲,不需要進行大規(guī)模的數(shù)據遷移。很多企業(yè)可能會傾向于前一類,這種模式能夠由較大的企業(yè)進行存儲的技術支撐和服務,而且不需要每年考慮存儲的擴展問題。但這一模式忽略了一個重要的事實,即所謂的大存儲都是建立在疊加的小存儲設備上的。換言之,現(xiàn)有系統(tǒng)中的所有的大容量存儲設備其實都是由一些小存儲設備通過優(yōu)化模板搭建起來的,例如通過RAID技術進行數(shù)據的保護等。而存儲設備等IT產品逐年價格的遞減是不爭的事實,與其提前若干年高價購置存儲,不如利用云存儲技術小規(guī)模的擴展存儲,不僅解決了數(shù)據存儲的可靠性問題,還可以獲得經濟上的便宜,這才是企業(yè)存儲管理的必由之路。
云存儲的原理圖如圖1所示。服務器與物理存儲通過云存儲核心進行數(shù)據管理。在圖1中,虛擬存儲器通常也稱為存儲池,是所有物理存儲器的邏輯映射集合。一般意義上的網關是指協(xié)議轉換器,往往是在傳輸層上實際網絡互連;而存儲網關是最近比較新穎的概念,它是指利用服務器等設備實現(xiàn)不同存儲之間的協(xié)議轉換,以便能夠通過這一設備實現(xiàn)對多個品牌、類型的存儲的訪問。也就是說,原有的存儲模式是將購置的存儲設備直接通過局域網絡連接到服務器上,通常為一個服務器所管理利用。而在云存儲環(huán)境中,存儲設備是通過局域網連接到存儲網關上,所有的服務器通過部署相應的軟件,利用存儲網關實現(xiàn)對存儲設備的訪問,即存儲設備與服務器不再是一一對應的關系,也不是一對多的關系,而是多對多的關系。多個不同的服務器可以同時訪問這些由存儲網關管理的存儲設備。
圖1 云存儲原理圖
存儲網關的介入,解決了存儲管理中的一個顯著的瓶頸,即不同的服務器管理著不同的存儲設備,這些存儲設備的共用會成為整個企業(yè)應用的一個難題。從這張簡單的原理圖可以看出,存儲網關的主要功能是支持不同網絡存儲設備的協(xié)議要求,并將所有的存儲設備進行統(tǒng)一的管理。因此,本研究在存儲網關中引入了存儲池的概念,它將所有物理的存儲設備映射到一個虛擬的存儲池中,所有服務器或者應用需要訪問的存儲都將從這一存儲池中獲取。這里面最關鍵的問題是原來需要安裝部署在服務器上的存儲設備都被遷移到了存儲網關上,這也解釋了為什么本研究一再強調基于網絡存儲的原因。也只有網絡存儲才適用于通過存儲網關不斷擴展的需求,如果是直連的存儲設備,不是不能體現(xiàn)在這種架構中,而是其數(shù)量與存儲網關的個數(shù)、數(shù)據接口數(shù)相關,并不能很隨意地增加擴充,因此不能講是真正意義上的云存儲。更重要的是,存儲網關不僅解決了存儲設備的連接問題,還解決了存儲設備的存儲I/O請求問題,而相對而言,直連設備的I/O請求方式與機制跟基于IP模式的存儲設備還是有本質上的區(qū)別。
從圖1中可以看出,目前這種基于網絡存儲的私有云存儲體系可以涵蓋FC架構、SAN網絡、NAS網絡存儲方式。
圖1其實并沒有將私有云和公有云進行區(qū)分,但私有云和公有云存儲的主要區(qū)別在于對存儲的訪問是在防火墻內還是外,因此這里也就不必要進行此細節(jié)的說明。
存儲網關這一系統(tǒng)的引入是基于網絡存儲的私有云存儲體系的關鍵。存儲網關不僅僅承擔存儲的設備連接任務,還承載著對存儲的I/O請求的處理任務。其主要軟件功能包括I/O請求包的獲取與轉發(fā)、虛擬存儲池的管理與映射邏輯管理、高可用性等其他數(shù)據保障技術支持等。由此可見,存儲網關的功能特點中,并不需要對存儲設備進行存儲模式的改變,當然這并不意味著不能對存儲模式進行改變,如果有更好的存儲模式、更有效的存儲管理功能、而存儲設備中又不存在需要遷移或只有極少量的數(shù)據需要遷移的話,對其存儲模式進行改變就是一個不錯的選擇。存儲網關的存儲I/O請求,其主要的任務事實上是轉發(fā),即將服務器針對存儲池中的虛擬設備的I/O請求轉換成對物理存儲設備的I/O請求。由于存儲池的存在,存儲池中的虛擬設備與實際的存儲物理設備間有某種映射關系存在,存儲網關的主要作用就是將這種映射關系清晰的定義出來,并將服務器的I/O請求轉換為對物理設備的I/O請求。更有意思的是,虛擬存儲設備的I/O請求可以完全與服務器對實際物理存儲設備的I/O請求一致,這樣,存儲網關的主要作用將變成簡單的I/O請求包的轉發(fā)及對存儲池的管理了。
本研究將就具體的云存儲涉及的幾個關鍵性技術進行原理性的闡述,說明存儲網關在實現(xiàn)私有云存儲技術中應考慮的主要關鍵技術。
2 云存儲關鍵技術實現(xiàn)
統(tǒng)一管理的存儲需求。私有云存儲體系中,各種存儲設備逐年按需采購,并不保證所有的產品之間具有兼容性,因此數(shù)據管理的統(tǒng)一性就變得十分的迫切。在實際操作中,研究者將所有的存儲設備都部署在相應的存儲網關中,以便存儲網關可以直接訪問它們。當有服務器需要對這些存儲設備進行訪問時,將向存儲網關提出請求。當然,提出的請求是以存儲網關的虛擬設備為訪問對象的。存儲網關收到這些I/O請求后,可以稍作變動,通過一定的策略,將對這些虛擬存儲設備的I/O請求轉換為對實際物理存儲設備的I/O請求。這里的關鍵不是I/O請求包的轉發(fā),而是存儲映射的策略。研究者可以在該策略中實現(xiàn)對存儲的負載均衡管理、對數(shù)據存儲的冗余性管理及對數(shù)據進行快照等技術響應。
I/O請求被轉發(fā)的示意圖如圖2所示。在圖2中,虛擬存儲設備的地址范圍可以由存儲網關自行定義和展現(xiàn)。其空間的大小既可以是實際的物理存儲的真實反映,也可以是動態(tài)的邏輯數(shù)值。這樣的處理模式可以解決存儲分配和存儲訪問請求之間的不對稱問題。簡而言之,就是將應用的存儲需求分為兩種,一種是對空間的分配需求,一種是對空間的訪問需求。只有對空間的訪問需求才需要直接映射到物理存儲設備上,而對空間的分配需求完全可以不考慮物理存儲設備的現(xiàn)狀,可以等到發(fā)生真正的訪問需求時才實際分配物理存儲設備到相應的虛擬存儲設備。這也是云存儲模式的優(yōu)勢之一。
圖2 I/O請求的映射轉換示意圖
如圖2所示,當服務器中有應用試圖訪問虛擬存儲設備192.1681.1.10時,存儲網關根據一定的策略選擇了物理存儲設備10.12.1.124,并將訪問的數(shù)據通過存儲網關返回給服務器。這里面,存儲網關除了在選擇相應的物理存儲設備時可以制定策略外,在返回數(shù)據前也可以通過一定的策略來進行,以便在實時響應和網絡流量間取得平衡。圖2沒有表示出來的內容更為豐富,例如在策略選擇中,虛擬存儲設備不僅可以映射到一個物理存儲設備上也可以映射到多個物理存儲設備。相應地,如果有多個虛擬存儲設備映射到同一個物理存儲設備上,也不是件復雜的事,這完全可以交由存儲網關根據訪問的負載均衡或者存儲的負載均衡策略,甚至是安全的負載均衡來決定。
存儲網關對外提供了存儲統(tǒng)一管理界面和存儲分配模式。所有的網絡存儲設備可以通過IP網絡或者其他如FC形式與存儲網關進行連接,并由它向外提供存儲服務。這樣一來,所有物理存儲設備的管理將集中到存儲網關中。這里面唯一的問題,其實也是最讓企業(yè)擔心的問題是,如果存儲網關故障,那么數(shù)據的訪問將會是怎樣的情況呢?實踐中,像這樣的存儲網關通常是成對出現(xiàn)的,即通過存儲網關的冗余來實現(xiàn)存儲訪問的高可用性。由此可見,在云存儲模式下,數(shù)據的高可用性是可以由3層不同的管理體系來保障的。第1層是存儲設備的供應商提供的基于存儲介質的數(shù)據保障,如RAID級別等。第2層是基于存儲網關軟件的數(shù)據保障,如不同物理設備間的互為備份等。第3層是基于存儲網關系統(tǒng)的數(shù)據保障,即通過對存儲網關的冗余部署來實現(xiàn)整個云存儲體系下的數(shù)據保障。
在實踐中,研究者還需要考慮數(shù)據保障問題,因為存儲網關的介質故障并不損害物理存儲的介質與數(shù)據,即使不通過冗余存儲網關的模式提高數(shù)據的高可用性,也可以通過延時機制,即重新部署新的存儲網關來恢復對數(shù)據的可用性。本研究擔心的問題是如果一旦決定從現(xiàn)有的云存儲機制還原到原有的服務器直接訪問物理存儲設備時,應該如何操作,如何確保數(shù)據、設備的可用。雖然有實驗證明確實可以還原,但是,在比較極端的條件下,這個還原過程還是比較復雜和費時的。首先是確定還原的物理存儲設備上有哪些數(shù)據需要剝離出來,其次是確定哪些數(shù)據需要遷移到還原設備上,最后才是通過費時的數(shù)據遷移過
程實現(xiàn)對原還物理設備的數(shù)據還原,并重新將其部署到指定的服務環(huán)境中。之所以工作如此復雜和麻煩,原因是存儲網關的負載均衡機制可以非常靈活,因此任何一臺物理存儲設備都有可能被分割成較小的若干存儲模塊,并擔任不同層面的存儲任務,從而導致實際物理設備上的數(shù)據本身并沒有簡潔的規(guī)律可尋,這最終造成了存儲設備數(shù)據還原的復雜性。
基于存儲網關軟件的數(shù)據安全保障模式,即將一個針對虛擬存儲設備的I/O請求分解為同時針對兩個物理存儲設備的I/O請求,并根據兩個I/O操作的返回來確定服務器應用的返回狀態(tài)。由于兩個物理設備采用的是IP網絡存儲,對存儲網關而言,只是簡單地將一個I/O請求同時分發(fā)給兩個物理存儲設備并處理返回結果而已。如果需要,可以將請求同時分發(fā)給更多的設備,也可以稍加改進,將I/O 的請求簡化為日志(LOG)分發(fā)到不同的存儲設備上,從而減少I/O操作和數(shù)據冗余,這特別適用于存儲用作數(shù)據庫的情形。這樣,如果要兩個完全互備的數(shù)據庫,只需要作兩個數(shù)據庫的日志互備,簡單有效。當然,如果是基于文件系統(tǒng)的話,存儲網關需要有自己的日志管理功能,以便最大程度降低I/O操作帶來的速度和帶寬問題。
而這種存儲的熱備機制不僅保障了數(shù)據,也在一定意義上提供了存儲的高可用性。由于存儲網關不僅擔負著數(shù)據分發(fā)的任務,同時也擔負著偵測物理存儲設備的運行狀態(tài)的任務,因此當其中某臺物理存儲設備宕機時,存儲網關可以實時的監(jiān)測到并適時地切換到另一臺存儲設備,這個過程可以完全地自動化進行,不需要人工干預。但對于物理設備的恢復而言,人工干預可以促進存儲網關重新進入熱備機制,而不至于在撤換損傷的設備后一直處于單副本的危險境地。所以,私有云存儲的高可用性實際上是通過兩個或多個存儲網關之間的配置來實現(xiàn)的。
實踐中,這種存儲網關的存儲高可用性也可在應用的高可用性上得到一定的體現(xiàn)。由于無論應用本身還是應用所依賴的數(shù)據都是某種形式存儲在設備上的,研究者可以將應用部署到相應的存儲中,并通過恢復存儲來達到恢復應用的目的。雖然這種情形受到部署、人工干預等的限制,但確實在實踐中具有樸素的高可用性特質。
在構建異地容災的存儲模式時,研究者也可以通過存儲網關的異地部署來實現(xiàn)。如果10.12.1.123 與10.12.1.124兩臺物理存儲設備是分置在不同物理地點的話,這個實例也就在某種意義上提供了異地容災的管理模式。由于I/O請求是一致分發(fā)的,理論上不存在兩個異地的物理存儲需要同步的問題,可以確保彼此間的數(shù)據的一致性。不過實踐中,由于網絡原因,無法保證兩邊的所有I/O操作都會被完整地、及時地傳輸?shù)街付ǖ拇鎯υO備上并被正確地執(zhí)行,因此兩個物理設備間會有一個小的時間差,這就需要在兩個物理存儲間形成一個同步的機制。而這個同步的機制不需要這兩個物理存儲設備來直接保障,仍然可以通過存儲網關來進行,如果在兩處物理位置中分別部署一臺存儲網關,這個同步機制就可以通過兩個存儲網關來協(xié)調進行。
3 結束語
本研究就是從基于網絡存儲的設備入手,引入存儲網關,從而解決多存儲設備分別由不同的服務器控制無法充分共享的問題,達到了統(tǒng)一管理的目標,也避免了云存儲架構下多種異構存儲設備的連接方式、訪問方式差異導致的云存儲體系搭建難題。筆者將這些相對次要的問題留待稍后去解決,不僅能夠解決實踐的存儲統(tǒng)一管理、逐年增長的問題,也符合云存儲體系中逐步擴展的核心理念。實際上,研究者可將存儲的問題也分為幾種不同層次、不同階段的解決方案,通過逐步實驗,逐步解決,最終解決所有兼容問題的模式來構建企業(yè)自屬的私有云存儲方案。
核心關注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務領域、行業(yè)應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業(yè)務領域的管理,全面涵蓋了企業(yè)關注ERP管理系統(tǒng)的核心領域,是眾多中小企業(yè)信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.oesoe.com/