1.引言
網(wǎng)絡(luò)虛擬化允許多個(gè)服務(wù)提供商動(dòng)態(tài)地組織多個(gè)異構(gòu)的虛擬網(wǎng)絡(luò),并在其上部署并管理客戶化的端到端業(yè)務(wù)。網(wǎng)絡(luò)虛擬化提供了在共享底層設(shè)施上運(yùn)行多個(gè)網(wǎng)絡(luò)的有效方式。并且,作為一種長期解決方案,網(wǎng)絡(luò)虛擬化在支持未來網(wǎng)絡(luò)中多種體系結(jié)構(gòu)同時(shí)共存方面發(fā)揮著重要的作用。
在網(wǎng)絡(luò)虛擬化環(huán)境中,傳統(tǒng)的網(wǎng)絡(luò)服務(wù)提供商(ISP)分離成基礎(chǔ)設(shè)施提供商(InP)和服務(wù)提供商(SP)。基礎(chǔ)設(shè)施提供商負(fù)責(zé)搭建底層物理網(wǎng)絡(luò),提供物理資源。服務(wù)提供商租賃底層物理資源,組建虛擬網(wǎng)絡(luò)并在虛擬網(wǎng)絡(luò)上部署客戶化的協(xié)議和應(yīng)用。有些文獻(xiàn)將SP進(jìn)一步分離為虛擬網(wǎng)絡(luò)提供商和應(yīng)用提供商。網(wǎng)絡(luò)虛擬化屏蔽了物理層的細(xì)節(jié),在技術(shù)上為網(wǎng)絡(luò)上運(yùn)行多樣化的協(xié)議和應(yīng)用提供了可能:在經(jīng)濟(jì)上通過共享底層基礎(chǔ)設(shè)施避免了對基礎(chǔ)設(shè)施的重復(fù)購買和運(yùn)維成本。可以預(yù)見.在未來網(wǎng)絡(luò)環(huán)境中。虛擬網(wǎng)絡(luò)之上將運(yùn)行日益豐富的網(wǎng)絡(luò)協(xié)議和應(yīng)用,而網(wǎng)絡(luò)的健壯性和生存性勢必成為網(wǎng)絡(luò)虛擬化研究和發(fā)展過程中一個(gè)不容忽視的問題。
故障管理是網(wǎng)絡(luò)管理中重要的研究領(lǐng)域。網(wǎng)絡(luò)故障管理的目標(biāo)是及時(shí)準(zhǔn)確地定位網(wǎng)絡(luò)故障,并迅速對網(wǎng)絡(luò)故障進(jìn)行響應(yīng),盡快隔離故障和恢復(fù)故障,從而盡可能減少或避免網(wǎng)絡(luò)故障對其上運(yùn)行的業(yè)務(wù)的影響。然而在網(wǎng)絡(luò)虛擬化環(huán)境中,虛擬網(wǎng)絡(luò)和設(shè)施擴(kuò)大了網(wǎng)絡(luò)的規(guī)模,為網(wǎng)絡(luò)狀態(tài)感知帶來更大的難度和復(fù)雜度:虛擬化技術(shù)在提供了按需創(chuàng)建、遷移、調(diào)整和撤銷虛擬網(wǎng)絡(luò)等靈活性的同時(shí),也導(dǎo)致虛擬網(wǎng)絡(luò)和物理網(wǎng)絡(luò)間映射關(guān)系的不確定,給建立故障傳播模型和診斷故障帶來一定的復(fù)雜性;此外.虛擬網(wǎng)絡(luò)和物理網(wǎng)絡(luò)對資源能力、服務(wù)質(zhì)量、管理成本等方面的需求也為網(wǎng)絡(luò)虛擬化環(huán)境下的故障恢復(fù)機(jī)制帶來很大的挑戰(zhàn)。而傳統(tǒng)IP網(wǎng)的故障探測、定位和恢復(fù)機(jī)制面向的是確定的、單一層次的網(wǎng)絡(luò),無法處理上述不確定性和映射約束,并且需要針對擴(kuò)大的網(wǎng)絡(luò)規(guī)模做出進(jìn)一步優(yōu)化。因此.需要提出相應(yīng)的故障管理機(jī)制,以便有效地對虛擬網(wǎng)絡(luò)故障狀態(tài)進(jìn)行探測.及時(shí)準(zhǔn)確地對虛擬網(wǎng)絡(luò)故障進(jìn)行定位.快速高效地將網(wǎng)絡(luò)和業(yè)務(wù)從故障影響中恢復(fù),從而提升虛擬網(wǎng)絡(luò)的頑健性、生存性和可管理性。
2.網(wǎng)絡(luò)虛擬化環(huán)境下的故障管理流程
網(wǎng)絡(luò)虛擬化環(huán)境下故障管理的基本過程為:通過在探測站點(diǎn)上發(fā)送一系列的探針,并收集探針返回的結(jié)果.獲得被管網(wǎng)絡(luò)中故障狀態(tài)信息;運(yùn)用癥狀信息并結(jié)合網(wǎng)絡(luò)中的故障傳播模型診斷引發(fā)癥狀的根源故障:最后基于故障的位置.將虛擬網(wǎng)絡(luò)及相應(yīng)的業(yè)務(wù)切換到預(yù)留的備份資源或臨時(shí)選擇的空閑資源上,最大限度減少或避免故障帶來的影響。
網(wǎng)絡(luò)虛擬化環(huán)境下故障管理的過程如圖1所示,各階段簡單描述如下。
圖1故障管理流程
故障探測階段:定期向網(wǎng)絡(luò)中發(fā)送探針,探測物理鏈路和節(jié)點(diǎn)以及虛擬鏈路和節(jié)點(diǎn)的運(yùn)行狀態(tài).并收集探測信息。為減少探測對網(wǎng)絡(luò)性能的影響并提高診斷的處理速度。該階段需要運(yùn)用優(yōu)化策略選取探測站點(diǎn)及探針集合。
故障定位階段:基于探測到的網(wǎng)絡(luò)癥狀信息和網(wǎng)絡(luò)的故障傳播模型,運(yùn)行故障診斷算法,根據(jù)診斷結(jié)果判定網(wǎng)絡(luò)環(huán)境中是否發(fā)生故障,如果存在故障則進(jìn)入故障恢復(fù)階段,如果未發(fā)生故障,則繼續(xù)定期探測網(wǎng)絡(luò)的運(yùn)行狀態(tài)。
故障恢復(fù)階段:如果采用預(yù)留資源的恢復(fù)方案,則調(diào)用預(yù)先設(shè)計(jì)好的備份恢復(fù)方案:如果不采用預(yù)留資源的恢復(fù)方案,則管理系統(tǒng)需根據(jù)故障發(fā)生位置,臨時(shí)為故障網(wǎng)絡(luò)和業(yè)務(wù)選取可用資源。無論是預(yù)留資源的恢復(fù)方案還是無預(yù)留資源的恢復(fù)方案均須遵循相應(yīng)的故障恢復(fù)策略,這些策略將綜合權(quán)衡質(zhì)量、容量、成本等各種因素。最后基于恢復(fù)方案對網(wǎng)絡(luò)設(shè)施進(jìn)行調(diào)整配置,實(shí)現(xiàn)故障恢復(fù)。
3.網(wǎng)絡(luò)虛擬化環(huán)境下故障管理的研究方向
基于網(wǎng)絡(luò)虛擬化環(huán)境的特性并圍繞故障管理流程的3個(gè)關(guān)鍵環(huán)節(jié)。要實(shí)現(xiàn)網(wǎng)絡(luò)虛擬化環(huán)境的故障管理.需要解決以下3個(gè)關(guān)鍵問題。
設(shè)計(jì)優(yōu)化的故障探測機(jī)制,感知網(wǎng)絡(luò)的故障狀態(tài)。
設(shè)計(jì)及時(shí)準(zhǔn)確的故障診斷機(jī)制,定位網(wǎng)絡(luò)故障。
研究基于資源容量、位置:成本等各種因素的故障恢復(fù)機(jī)制,滿足服務(wù)質(zhì)量要求。本文從故障探測、故障定位和故障恢復(fù)這3個(gè)方面簡要介紹網(wǎng)絡(luò)虛擬化環(huán)境下故障管理的研究方向并分析其研究趨勢。
3.1 故障探測機(jī)制
網(wǎng)絡(luò)虛擬化環(huán)境需要使用一種靈活、準(zhǔn)確、基于探針的主動(dòng)探測方法來獲取網(wǎng)絡(luò)故障狀態(tài)。這種方法通過向被管網(wǎng)絡(luò)發(fā)送探針,并搜集探針的返回結(jié)果,獲取網(wǎng)絡(luò)的故障信息,從而最終定位故障。網(wǎng)絡(luò)虛擬化環(huán)境在傳統(tǒng)的物理網(wǎng)絡(luò)設(shè)施的基礎(chǔ)上又增加了眾多并存的虛擬網(wǎng)絡(luò),因此要想全面獲取網(wǎng)絡(luò)的故障狀態(tài)信息所需要的探測規(guī)模急劇增加。然而大量的探測會(huì)為網(wǎng)絡(luò)和故障診斷帶來極大的開銷。對故障探測和診斷的及時(shí)性和實(shí)用性都帶來嚴(yán)重的影響。為保證探測的全面性同時(shí)降低探測成本、減少不必要探測為網(wǎng)絡(luò)和故障診斷帶來的開銷,需要對故障探測進(jìn)行優(yōu)化。具體來說涉及兩個(gè)方面:探針集合的優(yōu)化和探測站點(diǎn)的選擇優(yōu)化。
參考文獻(xiàn)采用不同的方法優(yōu)化主動(dòng)探測向系統(tǒng)發(fā)送的探針集合,以盡可能少的探針獲取更多的系統(tǒng)信息,同時(shí)盡可能降低計(jì)算復(fù)雜度。然而,網(wǎng)絡(luò)虛擬化環(huán)境中的網(wǎng)絡(luò)規(guī)模龐大.上述研究由于其計(jì)算復(fù)雜度過高對于大規(guī)模的網(wǎng)絡(luò)來說仍然無法適用,為此。需要研究更加高效的故障探針集合選擇方法,保證所選擇的探針集合在能夠探明系統(tǒng)故障情況的前提下,盡可能減小探針集合的規(guī)模。參考文獻(xiàn)研究了探測站點(diǎn)的選擇問題,以盡可能少的探測站點(diǎn)保證被管網(wǎng)絡(luò)所有節(jié)點(diǎn)的故障情況可被探測所確定。網(wǎng)絡(luò)虛擬化環(huán)境下,探測站點(diǎn)由于虛擬化的引入存在著更多的不確定性,節(jié)點(diǎn)可能失效和遷移,還需要在傳統(tǒng)的探測站點(diǎn)選擇方法的基礎(chǔ)上針對網(wǎng)絡(luò)虛擬化環(huán)境做進(jìn)一步的研究。
3.2故障定位機(jī)制
網(wǎng)絡(luò)虛擬化環(huán)境下的故障診斷是在某些故障發(fā)生之后,定位故障發(fā)生的具體位置,是故障恢復(fù)的基礎(chǔ)。故障傳播模型描述了被管網(wǎng)絡(luò)中故障與癥狀(探針返回的結(jié)果)之間的依賴關(guān)系。故障傳播模型是故障診斷的前提和基礎(chǔ)。由于虛擬化網(wǎng)絡(luò)中存在故障的多層次和關(guān)聯(lián)性、負(fù)載的隨機(jī)性、節(jié)點(diǎn)和鏈路的動(dòng)態(tài)遷移特性,適合于虛擬化網(wǎng)絡(luò)的故障傳播模型成為故障診斷的一個(gè)重要研究內(nèi)容。
在獲得故障傳播模型的基礎(chǔ)上。還需要針對不同系統(tǒng)的特性設(shè)計(jì)并優(yōu)化相應(yīng)的故障診斷方法。降低方法的復(fù)雜度,參考文獻(xiàn)研究不同系統(tǒng)下的故障診斷方法。在網(wǎng)絡(luò)虛擬化環(huán)境下,底層信息對于上層虛擬網(wǎng)絡(luò)的透明性是網(wǎng)絡(luò)虛擬化的一個(gè)顯著特點(diǎn)。底層信息的透明性是指底層網(wǎng)絡(luò)設(shè)備的運(yùn)行情況、底層設(shè)備的先驗(yàn)故障概率、虛擬網(wǎng)設(shè)備與底層網(wǎng)絡(luò)設(shè)備的映射關(guān)系等信息,對于虛擬網(wǎng)絡(luò)提供商都是不可知的。而且對于虛擬網(wǎng)絡(luò)提供商來說,除了底層物理故障可能導(dǎo)致虛擬網(wǎng)絡(luò)提供商的故障,虛擬化技術(shù)本身也可能引入新的故障。如何在底層信息透明的。情況下進(jìn)行物理故障和虛擬化故障這兩個(gè)層次的故障診斷是網(wǎng)絡(luò)虛擬化環(huán)境下需要解決的問題。
3.3 故障恢復(fù)機(jī)制
網(wǎng)絡(luò)虛擬化環(huán)境下的故障恢復(fù)機(jī)制為網(wǎng)絡(luò)的可靠性提供重要保障。故障恢復(fù)機(jī)制由故障觸發(fā),通過將虛擬網(wǎng)絡(luò)和相應(yīng)的業(yè)務(wù)切換到預(yù)留的備份資源或臨時(shí)選擇的空閑資源上,最大限度地減少或避免故障帶來的影響。因此故障恢復(fù)機(jī)制本質(zhì)上是故障發(fā)生條件下的資源分配問題。參考文獻(xiàn)研究了虛擬網(wǎng)絡(luò)映射問題,然而這些研究均假設(shè)網(wǎng)絡(luò)始終正常運(yùn)行,沒有考慮網(wǎng)絡(luò)故障的情況。網(wǎng)絡(luò)故障恢復(fù)機(jī)制從是否有備份資源預(yù)留的角度可以劃分為有資源預(yù)留的故障恢復(fù)機(jī)制和無資源預(yù)留的故障恢復(fù)機(jī)制。
有資源預(yù)留的故障恢復(fù)機(jī)制阮弱]應(yīng)用比例不為零的方案保證虛擬網(wǎng)絡(luò)的故障恢復(fù).這類問題通常也被稱為可生存的虛擬網(wǎng)絡(luò)映射問題(sunrivable virtualnetwork embedding,SVNE)。參考文獻(xiàn)提出了一種基于物理鏈路故障情況下的備份預(yù)留資源的分配方法。該方法可以保證多物理鏈路故障的恢復(fù)。參考文獻(xiàn)通過將虛擬網(wǎng)請求的拓?fù)鋽U(kuò)展從而映射擴(kuò)充后的請求的兩階段方法來實(shí)現(xiàn)單一網(wǎng)絡(luò)設(shè)施節(jié)點(diǎn)的故障恢復(fù)。方法的第一階段通過添加冗余節(jié)點(diǎn)和鏈路將原始的VN請求擴(kuò)展為一個(gè)可靠網(wǎng)絡(luò);第二階段,將擴(kuò)展后的網(wǎng)絡(luò)映射到物理網(wǎng)絡(luò)中。因此在第一階段如何擴(kuò)展網(wǎng)絡(luò)以及在第二階段如何通過盡可能共享資源減少物理資源的使用是這類方法需要解決的問題。參考文獻(xiàn)研究了帶有地理位置約束的單一網(wǎng)絡(luò)設(shè)施節(jié)點(diǎn)故障的恢復(fù)。參考文獻(xiàn)研究了單一區(qū)域故障條件下的故障恢復(fù)。
無資源預(yù)留的故障恢復(fù)機(jī)制只在故障確實(shí)發(fā)生并被探測到之后才會(huì)觸發(fā)執(zhí)行。通常。對于持續(xù)時(shí)間較短的故障,采取數(shù)據(jù)重傳的方法,而對于持續(xù)時(shí)間較長的故障,通過為受到故障影響的虛擬資源搜索新的物理資源并將該虛擬資源重新映射到新的物理資源上實(shí)現(xiàn)故障恢復(fù)。這類問題的研究當(dāng)前相對較少。一種最簡單的虛擬資源重映射方法聞可以不考慮問題空問的底層結(jié)構(gòu)和故障模式,只是簡單地為每一個(gè)受到故障影響的虛擬網(wǎng)絡(luò)重新計(jì)算資源映射方案。由于需要重新計(jì)算所有受到影響的虛擬網(wǎng)絡(luò)的整體映射,該方法會(huì)有很大的配置開銷,也會(huì)帶來較長時(shí)間的服務(wù)中斷。無資源預(yù)留的故障恢復(fù)機(jī)制本質(zhì)上是一種故障觸發(fā)的資源重映射,對這類問題的研究可以從縮小重映射可供選擇的底層物理資源的范圍人手.在映射之初計(jì)算出可供關(guān)鍵虛擬資源進(jìn)行重新映射的候選物理資源集合,但并不做任何資源預(yù)留,承載關(guān)鍵虛擬資源的物理資源出現(xiàn)故障時(shí),從事先確定的候選物理資源集合中選取可供重映射的物理資源。參考文獻(xiàn)采用這種思路研究單一物理鏈路故障的恢復(fù)問題。此外,由于物理資源的有,限性,有可能出現(xiàn)僅允許恢復(fù)部分業(yè)務(wù)的情況。因此對此類問題研究的重點(diǎn)在于候選資源集合的選取以及在資源有限的前提下如何根據(jù)虛擬業(yè)務(wù)的類型和級(jí)別確定故障恢復(fù)的優(yōu)先級(jí)。
4.結(jié)束語
網(wǎng)絡(luò)虛擬化環(huán)境下的故障管理對于網(wǎng)絡(luò)虛擬化環(huán)境下網(wǎng)絡(luò)的頑健性、生存性和可管理性具有重要的意義,其目標(biāo)是及時(shí)準(zhǔn)確定位網(wǎng)絡(luò)故障并迅速隔離和恢復(fù)故障。目前這方面的研究主要圍繞故障探測、故障定位和故障恢復(fù)這3個(gè)方面。在故障探測的研究方面,針對網(wǎng)絡(luò)虛擬化環(huán)境下網(wǎng)絡(luò)規(guī)模擴(kuò)大的特點(diǎn),需要研究優(yōu)化的探測機(jī)制.包括探測站點(diǎn)和探針集合的優(yōu)化選擇機(jī)制。在故障定位的研究方面,針對多層網(wǎng)絡(luò)以及虛擬網(wǎng)絡(luò)和物理網(wǎng)絡(luò)間映射關(guān)系的不確定性等特點(diǎn).需要研究網(wǎng)絡(luò)虛擬化環(huán)境下的故障傳播模型以及相應(yīng)的故障診斷方法。在故障恢復(fù)的研究方面,針對網(wǎng)絡(luò)虛擬化環(huán)境下對服務(wù)質(zhì)量的要求,需要研究合理的故障恢復(fù)策略,在有限的物理網(wǎng)絡(luò)資源之上生成資源提供成本低且違約損失少的故障恢復(fù)方案。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.oesoe.com/
本文標(biāo)題:網(wǎng)絡(luò)虛擬化環(huán)境下的故障管理
本文網(wǎng)址:http://www.oesoe.com/html/support/11121511675.html