1.引言
網(wǎng)絡(luò)虛擬化允許多個服務(wù)提供商動態(tài)地組織多個異構(gòu)的虛擬網(wǎng)絡(luò),并在其上部署并管理客戶化的端到端業(yè)務(wù)。網(wǎng)絡(luò)虛擬化提供了在共享底層設(shè)施上運行多個網(wǎng)絡(luò)的有效方式。并且,作為一種長期解決方案,網(wǎng)絡(luò)虛擬化在支持未來網(wǎng)絡(luò)中多種體系結(jié)構(gòu)同時共存方面發(fā)揮著重要的作用。
在網(wǎng)絡(luò)虛擬化環(huán)境中,傳統(tǒng)的網(wǎng)絡(luò)服務(wù)提供商(ISP)分離成基礎(chǔ)設(shè)施提供商(InP)和服務(wù)提供商(SP)。基礎(chǔ)設(shè)施提供商負(fù)責(zé)搭建底層物理網(wǎng)絡(luò),提供物理資源。服務(wù)提供商租賃底層物理資源,組建虛擬網(wǎng)絡(luò)并在虛擬網(wǎng)絡(luò)上部署客戶化的協(xié)議和應(yīng)用。有些文獻將SP進一步分離為虛擬網(wǎng)絡(luò)提供商和應(yīng)用提供商。網(wǎng)絡(luò)虛擬化屏蔽了物理層的細(xì)節(jié),在技術(shù)上為網(wǎng)絡(luò)上運行多樣化的協(xié)議和應(yīng)用提供了可能:在經(jīng)濟上通過共享底層基礎(chǔ)設(shè)施避免了對基礎(chǔ)設(shè)施的重復(fù)購買和運維成本。可以預(yù)見.在未來網(wǎng)絡(luò)環(huán)境中。虛擬網(wǎng)絡(luò)之上將運行日益豐富的網(wǎng)絡(luò)協(xié)議和應(yīng)用,而網(wǎng)絡(luò)的健壯性和生存性勢必成為網(wǎng)絡(luò)虛擬化研究和發(fā)展過程中一個不容忽視的問題。
故障管理是網(wǎng)絡(luò)管理中重要的研究領(lǐng)域。網(wǎng)絡(luò)故障管理的目標(biāo)是及時準(zhǔn)確地定位網(wǎng)絡(luò)故障,并迅速對網(wǎng)絡(luò)故障進行響應(yīng),盡快隔離故障和恢復(fù)故障,從而盡可能減少或避免網(wǎng)絡(luò)故障對其上運行的業(yè)務(wù)的影響。然而在網(wǎng)絡(luò)虛擬化環(huán)境中,虛擬網(wǎng)絡(luò)和設(shè)施擴大了網(wǎng)絡(luò)的規(guī)模,為網(wǎng)絡(luò)狀態(tài)感知帶來更大的難度和復(fù)雜度:虛擬化技術(shù)在提供了按需創(chuàng)建、遷移、調(diào)整和撤銷虛擬網(wǎng)絡(luò)等靈活性的同時,也導(dǎo)致虛擬網(wǎng)絡(luò)和物理網(wǎng)絡(luò)間映射關(guān)系的不確定,給建立故障傳播模型和診斷故障帶來一定的復(fù)雜性;此外.虛擬網(wǎng)絡(luò)和物理網(wǎng)絡(luò)對資源能力、服務(wù)質(zhì)量、管理成本等方面的需求也為網(wǎng)絡(luò)虛擬化環(huán)境下的故障恢復(fù)機制帶來很大的挑戰(zhàn)。而傳統(tǒng)IP網(wǎng)的故障探測、定位和恢復(fù)機制面向的是確定的、單一層次的網(wǎng)絡(luò),無法處理上述不確定性和映射約束,并且需要針對擴大的網(wǎng)絡(luò)規(guī)模做出進一步優(yōu)化。因此.需要提出相應(yīng)的故障管理機制,以便有效地對虛擬網(wǎng)絡(luò)故障狀態(tài)進行探測.及時準(zhǔn)確地對虛擬網(wǎng)絡(luò)故障進行定位.快速高效地將網(wǎng)絡(luò)和業(yè)務(wù)從故障影響中恢復(fù),從而提升虛擬網(wǎng)絡(luò)的頑健性、生存性和可管理性。
2.網(wǎng)絡(luò)虛擬化環(huán)境下的故障管理流程
網(wǎng)絡(luò)虛擬化環(huán)境下故障管理的基本過程為:通過在探測站點上發(fā)送一系列的探針,并收集探針返回的結(jié)果.獲得被管網(wǎng)絡(luò)中故障狀態(tài)信息;運用癥狀信息并結(jié)合網(wǎng)絡(luò)中的故障傳播模型診斷引發(fā)癥狀的根源故障:最后基于故障的位置.將虛擬網(wǎng)絡(luò)及相應(yīng)的業(yè)務(wù)切換到預(yù)留的備份資源或臨時選擇的空閑資源上,最大限度減少或避免故障帶來的影響。
網(wǎng)絡(luò)虛擬化環(huán)境下故障管理的過程如圖1所示,各階段簡單描述如下。
圖1故障管理流程
故障探測階段:定期向網(wǎng)絡(luò)中發(fā)送探針,探測物理鏈路和節(jié)點以及虛擬鏈路和節(jié)點的運行狀態(tài).并收集探測信息。為減少探測對網(wǎng)絡(luò)性能的影響并提高診斷的處理速度。該階段需要運用優(yōu)化策略選取探測站點及探針集合。
故障定位階段:基于探測到的網(wǎng)絡(luò)癥狀信息和網(wǎng)絡(luò)的故障傳播模型,運行故障診斷算法,根據(jù)診斷結(jié)果判定網(wǎng)絡(luò)環(huán)境中是否發(fā)生故障,如果存在故障則進入故障恢復(fù)階段,如果未發(fā)生故障,則繼續(xù)定期探測網(wǎng)絡(luò)的運行狀態(tài)。
故障恢復(fù)階段:如果采用預(yù)留資源的恢復(fù)方案,則調(diào)用預(yù)先設(shè)計好的備份恢復(fù)方案:如果不采用預(yù)留資源的恢復(fù)方案,則管理系統(tǒng)需根據(jù)故障發(fā)生位置,臨時為故障網(wǎng)絡(luò)和業(yè)務(wù)選取可用資源。無論是預(yù)留資源的恢復(fù)方案還是無預(yù)留資源的恢復(fù)方案均須遵循相應(yīng)的故障恢復(fù)策略,這些策略將綜合權(quán)衡質(zhì)量、容量、成本等各種因素。最后基于恢復(fù)方案對網(wǎng)絡(luò)設(shè)施進行調(diào)整配置,實現(xiàn)故障恢復(fù)。
3.網(wǎng)絡(luò)虛擬化環(huán)境下故障管理的研究方向
基于網(wǎng)絡(luò)虛擬化環(huán)境的特性并圍繞故障管理流程的3個關(guān)鍵環(huán)節(jié)。要實現(xiàn)網(wǎng)絡(luò)虛擬化環(huán)境的故障管理.需要解決以下3個關(guān)鍵問題。
設(shè)計優(yōu)化的故障探測機制,感知網(wǎng)絡(luò)的故障狀態(tài)。
設(shè)計及時準(zhǔn)確的故障診斷機制,定位網(wǎng)絡(luò)故障。
研究基于資源容量、位置:成本等各種因素的故障恢復(fù)機制,滿足服務(wù)質(zhì)量要求。本文從故障探測、故障定位和故障恢復(fù)這3個方面簡要介紹網(wǎng)絡(luò)虛擬化環(huán)境下故障管理的研究方向并分析其研究趨勢。
3.1 故障探測機制
網(wǎng)絡(luò)虛擬化環(huán)境需要使用一種靈活、準(zhǔn)確、基于探針的主動探測方法來獲取網(wǎng)絡(luò)故障狀態(tài)。這種方法通過向被管網(wǎng)絡(luò)發(fā)送探針,并搜集探針的返回結(jié)果,獲取網(wǎng)絡(luò)的故障信息,從而最終定位故障。網(wǎng)絡(luò)虛擬化環(huán)境在傳統(tǒng)的物理網(wǎng)絡(luò)設(shè)施的基礎(chǔ)上又增加了眾多并存的虛擬網(wǎng)絡(luò),因此要想全面獲取網(wǎng)絡(luò)的故障狀態(tài)信息所需要的探測規(guī)模急劇增加。然而大量的探測會為網(wǎng)絡(luò)和故障診斷帶來極大的開銷。對故障探測和診斷的及時性和實用性都帶來嚴(yán)重的影響。為保證探測的全面性同時降低探測成本、減少不必要探測為網(wǎng)絡(luò)和故障診斷帶來的開銷,需要對故障探測進行優(yōu)化。具體來說涉及兩個方面:探針集合的優(yōu)化和探測站點的選擇優(yōu)化。
參考文獻采用不同的方法優(yōu)化主動探測向系統(tǒng)發(fā)送的探針集合,以盡可能少的探針獲取更多的系統(tǒng)信息,同時盡可能降低計算復(fù)雜度。然而,網(wǎng)絡(luò)虛擬化環(huán)境中的網(wǎng)絡(luò)規(guī)模龐大.上述研究由于其計算復(fù)雜度過高對于大規(guī)模的網(wǎng)絡(luò)來說仍然無法適用,為此。需要研究更加高效的故障探針集合選擇方法,保證所選擇的探針集合在能夠探明系統(tǒng)故障情況的前提下,盡可能減小探針集合的規(guī)模。參考文獻研究了探測站點的選擇問題,以盡可能少的探測站點保證被管網(wǎng)絡(luò)所有節(jié)點的故障情況可被探測所確定。網(wǎng)絡(luò)虛擬化環(huán)境下,探測站點由于虛擬化的引入存在著更多的不確定性,節(jié)點可能失效和遷移,還需要在傳統(tǒng)的探測站點選擇方法的基礎(chǔ)上針對網(wǎng)絡(luò)虛擬化環(huán)境做進一步的研究。
3.2故障定位機制
網(wǎng)絡(luò)虛擬化環(huán)境下的故障診斷是在某些故障發(fā)生之后,定位故障發(fā)生的具體位置,是故障恢復(fù)的基礎(chǔ)。故障傳播模型描述了被管網(wǎng)絡(luò)中故障與癥狀(探針返回的結(jié)果)之間的依賴關(guān)系。故障傳播模型是故障診斷的前提和基礎(chǔ)。由于虛擬化網(wǎng)絡(luò)中存在故障的多層次和關(guān)聯(lián)性、負(fù)載的隨機性、節(jié)點和鏈路的動態(tài)遷移特性,適合于虛擬化網(wǎng)絡(luò)的故障傳播模型成為故障診斷的一個重要研究內(nèi)容。
在獲得故障傳播模型的基礎(chǔ)上。還需要針對不同系統(tǒng)的特性設(shè)計并優(yōu)化相應(yīng)的故障診斷方法。降低方法的復(fù)雜度,參考文獻研究不同系統(tǒng)下的故障診斷方法。在網(wǎng)絡(luò)虛擬化環(huán)境下,底層信息對于上層虛擬網(wǎng)絡(luò)的透明性是網(wǎng)絡(luò)虛擬化的一個顯著特點。底層信息的透明性是指底層網(wǎng)絡(luò)設(shè)備的運行情況、底層設(shè)備的先驗故障概率、虛擬網(wǎng)設(shè)備與底層網(wǎng)絡(luò)設(shè)備的映射關(guān)系等信息,對于虛擬網(wǎng)絡(luò)提供商都是不可知的。而且對于虛擬網(wǎng)絡(luò)提供商來說,除了底層物理故障可能導(dǎo)致虛擬網(wǎng)絡(luò)提供商的故障,虛擬化技術(shù)本身也可能引入新的故障。如何在底層信息透明的。情況下進行物理故障和虛擬化故障這兩個層次的故障診斷是網(wǎng)絡(luò)虛擬化環(huán)境下需要解決的問題。
3.3 故障恢復(fù)機制
網(wǎng)絡(luò)虛擬化環(huán)境下的故障恢復(fù)機制為網(wǎng)絡(luò)的可靠性提供重要保障。故障恢復(fù)機制由故障觸發(fā),通過將虛擬網(wǎng)絡(luò)和相應(yīng)的業(yè)務(wù)切換到預(yù)留的備份資源或臨時選擇的空閑資源上,最大限度地減少或避免故障帶來的影響。因此故障恢復(fù)機制本質(zhì)上是故障發(fā)生條件下的資源分配問題。參考文獻研究了虛擬網(wǎng)絡(luò)映射問題,然而這些研究均假設(shè)網(wǎng)絡(luò)始終正常運行,沒有考慮網(wǎng)絡(luò)故障的情況。網(wǎng)絡(luò)故障恢復(fù)機制從是否有備份資源預(yù)留的角度可以劃分為有資源預(yù)留的故障恢復(fù)機制和無資源預(yù)留的故障恢復(fù)機制。
有資源預(yù)留的故障恢復(fù)機制阮弱]應(yīng)用比例不為零的方案保證虛擬網(wǎng)絡(luò)的故障恢復(fù).這類問題通常也被稱為可生存的虛擬網(wǎng)絡(luò)映射問題(sunrivable virtualnetwork embedding,SVNE)。參考文獻提出了一種基于物理鏈路故障情況下的備份預(yù)留資源的分配方法。該方法可以保證多物理鏈路故障的恢復(fù)。參考文獻通過將虛擬網(wǎng)請求的拓?fù)鋽U展從而映射擴充后的請求的兩階段方法來實現(xiàn)單一網(wǎng)絡(luò)設(shè)施節(jié)點的故障恢復(fù)。方法的第一階段通過添加冗余節(jié)點和鏈路將原始的VN請求擴展為一個可靠網(wǎng)絡(luò);第二階段,將擴展后的網(wǎng)絡(luò)映射到物理網(wǎng)絡(luò)中。因此在第一階段如何擴展網(wǎng)絡(luò)以及在第二階段如何通過盡可能共享資源減少物理資源的使用是這類方法需要解決的問題。參考文獻研究了帶有地理位置約束的單一網(wǎng)絡(luò)設(shè)施節(jié)點故障的恢復(fù)。參考文獻研究了單一區(qū)域故障條件下的故障恢復(fù)。
無資源預(yù)留的故障恢復(fù)機制只在故障確實發(fā)生并被探測到之后才會觸發(fā)執(zhí)行。通常。對于持續(xù)時間較短的故障,采取數(shù)據(jù)重傳的方法,而對于持續(xù)時間較長的故障,通過為受到故障影響的虛擬資源搜索新的物理資源并將該虛擬資源重新映射到新的物理資源上實現(xiàn)故障恢復(fù)。這類問題的研究當(dāng)前相對較少。一種最簡單的虛擬資源重映射方法聞可以不考慮問題空問的底層結(jié)構(gòu)和故障模式,只是簡單地為每一個受到故障影響的虛擬網(wǎng)絡(luò)重新計算資源映射方案。由于需要重新計算所有受到影響的虛擬網(wǎng)絡(luò)的整體映射,該方法會有很大的配置開銷,也會帶來較長時間的服務(wù)中斷。無資源預(yù)留的故障恢復(fù)機制本質(zhì)上是一種故障觸發(fā)的資源重映射,對這類問題的研究可以從縮小重映射可供選擇的底層物理資源的范圍人手.在映射之初計算出可供關(guān)鍵虛擬資源進行重新映射的候選物理資源集合,但并不做任何資源預(yù)留,承載關(guān)鍵虛擬資源的物理資源出現(xiàn)故障時,從事先確定的候選物理資源集合中選取可供重映射的物理資源。參考文獻采用這種思路研究單一物理鏈路故障的恢復(fù)問題。此外,由于物理資源的有,限性,有可能出現(xiàn)僅允許恢復(fù)部分業(yè)務(wù)的情況。因此對此類問題研究的重點在于候選資源集合的選取以及在資源有限的前提下如何根據(jù)虛擬業(yè)務(wù)的類型和級別確定故障恢復(fù)的優(yōu)先級。
4.結(jié)束語
網(wǎng)絡(luò)虛擬化環(huán)境下的故障管理對于網(wǎng)絡(luò)虛擬化環(huán)境下網(wǎng)絡(luò)的頑健性、生存性和可管理性具有重要的意義,其目標(biāo)是及時準(zhǔn)確定位網(wǎng)絡(luò)故障并迅速隔離和恢復(fù)故障。目前這方面的研究主要圍繞故障探測、故障定位和故障恢復(fù)這3個方面。在故障探測的研究方面,針對網(wǎng)絡(luò)虛擬化環(huán)境下網(wǎng)絡(luò)規(guī)模擴大的特點,需要研究優(yōu)化的探測機制.包括探測站點和探針集合的優(yōu)化選擇機制。在故障定位的研究方面,針對多層網(wǎng)絡(luò)以及虛擬網(wǎng)絡(luò)和物理網(wǎng)絡(luò)間映射關(guān)系的不確定性等特點.需要研究網(wǎng)絡(luò)虛擬化環(huán)境下的故障傳播模型以及相應(yīng)的故障診斷方法。在故障恢復(fù)的研究方面,針對網(wǎng)絡(luò)虛擬化環(huán)境下對服務(wù)質(zhì)量的要求,需要研究合理的故障恢復(fù)策略,在有限的物理網(wǎng)絡(luò)資源之上生成資源提供成本低且違約損失少的故障恢復(fù)方案。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://m.hanmeixuan.com/
本文標(biāo)題:網(wǎng)絡(luò)虛擬化環(huán)境下的故障管理
本文網(wǎng)址:http://m.hanmeixuan.com/html/support/11121511675.html