1 引言
近年來,隨著網(wǎng)絡(luò)和通信技術(shù)的發(fā)展,Internet已成為人們?nèi)粘I畈豢扇鄙俚男畔⒔涣髌脚_,進(jìn)而促進(jìn)網(wǎng)絡(luò)數(shù)字內(nèi)容業(yè)的快速發(fā)展,也為數(shù)字內(nèi)容產(chǎn)業(yè)帶來前所未有的商機(jī),據(jù)統(tǒng)計(jì),截止2011年4月,亞馬遜電子書銷量首次超過了印刷書銷量,百度庫內(nèi)文件接近2000萬份,并繼續(xù)保持高速增長,而有蘭登書屋等六大出版商人駐ihook,ipad銷量已超2000萬臺,但當(dāng)前大多數(shù)數(shù)字內(nèi)容提供商仍然采用傳統(tǒng)的C/S模式構(gòu)建自己的數(shù)字內(nèi)容服務(wù)系統(tǒng),為眾多終端用戶提供內(nèi)容服務(wù),這種模式隨著Internet規(guī)模和用戶人數(shù)的增加會(huì)存在網(wǎng)絡(luò)熱點(diǎn)的問題,為此,一些數(shù)字內(nèi)容提供商試圖采用新的技術(shù)來解決上述問題,如亞馬遜構(gòu)建了自己的云服務(wù)系統(tǒng)(彈性計(jì)算云Elastic Compute Cloud,EC2),現(xiàn)實(shí)結(jié)果顯示,該系統(tǒng)適合亞馬遜的數(shù)字內(nèi)容服務(wù)特點(diǎn),極大促進(jìn)了亞馬遜業(yè)務(wù)發(fā)展,云計(jì)算機(jī)的核心思想是通過虛擬技術(shù)將是將大量用網(wǎng)絡(luò)連接的計(jì)算資源統(tǒng)一管理和調(diào)度,構(gòu)成一個(gè)計(jì)算資源池向用戶按需服務(wù),從而為終端用戶提供靈活高效的服務(wù),顯然,上述優(yōu)勢的取得是通過在現(xiàn)有網(wǎng)絡(luò)上部署服務(wù)節(jié)點(diǎn)來實(shí)現(xiàn)的,服務(wù)節(jié)點(diǎn)位置選擇的合適與否,直接影響到云服務(wù)系統(tǒng)的服務(wù)質(zhì)量和使用效率。
服務(wù)節(jié)點(diǎn)部署是傳統(tǒng)網(wǎng)絡(luò)和CDN網(wǎng)絡(luò)關(guān)注的熱點(diǎn)和難點(diǎn),產(chǎn)生了很多有意義的成果,但計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)的飛速發(fā)展以及云計(jì)算技術(shù)的特點(diǎn),使得傳統(tǒng)服務(wù)節(jié)點(diǎn)部署理論在解決云計(jì)算系統(tǒng)服務(wù)節(jié)點(diǎn)部署時(shí)需要解決眾多挑戰(zhàn),包括網(wǎng)絡(luò)信息缺乏和已有部署理論的局限性,由于測量技術(shù)和測量設(shè)備的限制,設(shè)計(jì)者在復(fù)雜網(wǎng)絡(luò)環(huán)境下選擇部署點(diǎn)時(shí)會(huì)面臨不同程度的信息缺失,甚至?xí)霈F(xiàn)無法獲取建模需要的先驗(yàn)知識的情況,同時(shí),傳統(tǒng)基于圖論的服務(wù)節(jié)點(diǎn)選擇方案存在NP難喝和搜索效率隨樣本數(shù)增加快速下降的缺陷,此外,在現(xiàn)實(shí)應(yīng)用中,設(shè)計(jì)者除了需要解決上述理論局限性外,還要考慮簡單實(shí)用等因素,針對上述問題及實(shí)際服務(wù)器部署的特點(diǎn),本文提出一種基于網(wǎng)絡(luò)坐標(biāo)系統(tǒng)的服務(wù)器部署方法,與傳統(tǒng)服務(wù)器部署相比,該方法可以較小的代價(jià)獲得較完整的互聯(lián)網(wǎng)時(shí)延信息,解決了傳統(tǒng)方法中無法獲得完整網(wǎng)絡(luò)信息的問題;同時(shí)該方法采用聚類方法,避免了傳統(tǒng)服務(wù)器部署存在的NP-hard和搜索效率低下的問題。
2 基于網(wǎng)絡(luò)坐標(biāo)服務(wù)器部署方案
圖1為基于網(wǎng)絡(luò)坐標(biāo)服務(wù)器部署方法整體框圖,可以看出,構(gòu)建基于網(wǎng)絡(luò)坐標(biāo)的服務(wù)器部署方案包括網(wǎng)絡(luò)信息獲取、部署方案形成和部署方案驗(yàn)證等三部分,其中,網(wǎng)絡(luò)信息獲取主要解決服務(wù)器部署中信息獲取不完整的問題,其核心思想是通過ping測量技術(shù),構(gòu)建網(wǎng)絡(luò)坐標(biāo),從而以較少的測量成本獲取較為完整的網(wǎng)絡(luò)信息,包括網(wǎng)絡(luò)坐標(biāo)基準(zhǔn)點(diǎn)的選擇和網(wǎng)絡(luò)坐標(biāo)的形成兩部分,本文采用中央控制網(wǎng)絡(luò)坐標(biāo)的構(gòu)成方式;部署方案形成部分在已構(gòu)建好的網(wǎng)絡(luò)坐標(biāo)的基礎(chǔ)上實(shí)現(xiàn)服務(wù)器部署方案,包括服務(wù)器選擇和服務(wù)資源分配等兩部分,前者在構(gòu)建好的網(wǎng)絡(luò)坐標(biāo)基礎(chǔ)上實(shí)現(xiàn)服務(wù)器選址工作,即根據(jù)得到的網(wǎng)絡(luò)坐標(biāo),將樣本點(diǎn)進(jìn)行聚類,得到若干個(gè)邏輯節(jié)點(diǎn),然后將獲得的邏輯節(jié)點(diǎn)轉(zhuǎn)換成現(xiàn)實(shí)中的IP值,并進(jìn)一步獲得服務(wù)器部署的物理位置,在這里,文章對傳統(tǒng)分層聚類方法進(jìn)行改進(jìn),使之在考慮測量樣本分布密度的同時(shí),也考慮了服務(wù)器部署成本和服務(wù)性能等因素,能準(zhǔn)確反映真實(shí)的網(wǎng)絡(luò)環(huán)境,并以此來獲得服務(wù)器部署方案,在部署方案驗(yàn)證部分,文章通過將傳統(tǒng)服務(wù)器部署方案與基于網(wǎng)絡(luò)坐標(biāo)的服務(wù)器部署方案的服務(wù)性能進(jìn)行對比,以驗(yàn)證基于網(wǎng)絡(luò)坐標(biāo)的服務(wù)器部署方法的有效性。
圖1基于網(wǎng)絡(luò)坐標(biāo)服務(wù)器部署方法框圖
3 基于網(wǎng)絡(luò)坐標(biāo)的服務(wù)器部署的關(guān)鍵技術(shù)
由圖1可知,基于網(wǎng)絡(luò)坐標(biāo)服務(wù)器部署方案的核心技術(shù)包括網(wǎng)絡(luò)基準(zhǔn)點(diǎn)的選擇和分層聚類算法兩種。
3.1基準(zhǔn)點(diǎn)選擇
在中央控制式網(wǎng)絡(luò)坐標(biāo)體系中,網(wǎng)絡(luò)坐標(biāo)的構(gòu)建首先通過部署網(wǎng)絡(luò)探測點(diǎn),通過網(wǎng)絡(luò)探測點(diǎn)獲得網(wǎng)絡(luò)節(jié)點(diǎn)的延遲信息,并選擇網(wǎng)絡(luò)基準(zhǔn)點(diǎn),構(gòu)建網(wǎng)絡(luò)坐標(biāo)系,然后,通過基準(zhǔn)點(diǎn)的測量來獲取客戶端到網(wǎng)絡(luò)基準(zhǔn)點(diǎn)的延遲,根據(jù)網(wǎng)絡(luò)基準(zhǔn)點(diǎn)的坐標(biāo)計(jì)算出該客戶端在網(wǎng)絡(luò)坐標(biāo)系統(tǒng)中的坐標(biāo)值,構(gòu)建Internet的網(wǎng)絡(luò)結(jié)構(gòu)圖,在上述過程中,網(wǎng)絡(luò)基準(zhǔn)點(diǎn)具有三重作用:構(gòu)建網(wǎng)絡(luò)坐標(biāo)系的三要素(維度、坐標(biāo)原點(diǎn)和刻度)、網(wǎng)絡(luò)延遲測量的主機(jī)和網(wǎng)絡(luò)坐標(biāo)定位基礎(chǔ),因此,基準(zhǔn)點(diǎn)的選擇對網(wǎng)絡(luò)坐標(biāo)的精度有重要的影響。
張輝,P.Francis和M. Rabinovich等人對網(wǎng)絡(luò)坐標(biāo)系基準(zhǔn)點(diǎn)做了研究,其中,張輝等人通過在已部署的探測節(jié)點(diǎn)中選擇坐標(biāo)基準(zhǔn)點(diǎn),并提出了3條準(zhǔn)則:
1)最大分離度準(zhǔn)則;
2)N-Median準(zhǔn)則;
3)N-cluster-Median.
在此基礎(chǔ)上,通過實(shí)驗(yàn)證明了與三角坐標(biāo)和IDMap網(wǎng)絡(luò)坐標(biāo)系相比,GNP即使采用隨機(jī)選擇的網(wǎng)絡(luò)基準(zhǔn)點(diǎn),也具有更好的穩(wěn)定性,且當(dāng)基準(zhǔn)點(diǎn)為6,坐標(biāo)維度為5時(shí),網(wǎng)絡(luò)坐標(biāo)具有較好的準(zhǔn)確性,在文獻(xiàn)〔7〕中,P. Francis等人詳細(xì)研究了IDMap系中探測點(diǎn)的選址問題,并將該問題模型化為已知網(wǎng)絡(luò)拓?fù)淝闆r下的圖論問題,M. Rabinovich等人則通過對統(tǒng)計(jì)數(shù)據(jù)的分析,證實(shí)了在網(wǎng)絡(luò)坐標(biāo)系中,選擇距離較遠(yuǎn)的3個(gè)節(jié)點(diǎn)作為網(wǎng)絡(luò)基準(zhǔn)點(diǎn),對于大多數(shù)情況下,能夠獲取滿意的網(wǎng)絡(luò)坐標(biāo)精度。
在服務(wù)器部署方案設(shè)計(jì)過程中,由于服務(wù)器部署方案中的節(jié)點(diǎn)位置選擇和資源部署都屬于靜態(tài)過程,而且在較長時(shí)間不會(huì)發(fā)生改變,因此,用于服務(wù)器部署應(yīng)用的網(wǎng)絡(luò)坐標(biāo)系統(tǒng)的基準(zhǔn)點(diǎn)選擇需要定義一系列新的準(zhǔn)則,因此,基準(zhǔn)點(diǎn)選擇可采用如下3種準(zhǔn)則:
1)被選擇的基準(zhǔn)點(diǎn)間的網(wǎng)絡(luò)距離應(yīng)該足夠大;
2)基準(zhǔn)點(diǎn)的個(gè)數(shù)應(yīng)該比網(wǎng)絡(luò)坐標(biāo)維度數(shù)大;
3)基準(zhǔn)點(diǎn)應(yīng)盡量選擇靠近骨干網(wǎng)絡(luò)POP處.
在一個(gè)網(wǎng)絡(luò)坐標(biāo)空間里,如果用N表示節(jié)點(diǎn)集,i,j表示空間中兩點(diǎn),xi, xj分別表示點(diǎn)i和點(diǎn)j在坐標(biāo)系統(tǒng)中的坐標(biāo)向量,d(i,j)表示點(diǎn)i和點(diǎn)J間在坐標(biāo)中的距離函數(shù),則有
顯然,選擇的基準(zhǔn)點(diǎn)間的網(wǎng)絡(luò)距離應(yīng)該足夠大時(shí),才能保證測量數(shù)據(jù)的精度。
一般來說,使用基準(zhǔn)點(diǎn)構(gòu)建網(wǎng)絡(luò)坐標(biāo)系統(tǒng)時(shí),基準(zhǔn)點(diǎn)和網(wǎng)絡(luò)坐標(biāo)維度存在如下關(guān)系:N>d+1,其中,N表示基準(zhǔn)點(diǎn)個(gè)數(shù),d表示網(wǎng)絡(luò)坐標(biāo)系統(tǒng)的維度數(shù)。
此外,在基于網(wǎng)絡(luò)的服務(wù)器部署方法中,構(gòu)建網(wǎng)絡(luò)坐標(biāo)的核心任務(wù)是以盡量小的測量成本來獲取完整的網(wǎng)絡(luò)結(jié)構(gòu)信息,便于實(shí)現(xiàn)服務(wù)器部署的選址和資源分配工作,因此,基準(zhǔn)點(diǎn)的部署應(yīng)該選擇能夠直接獲取較多網(wǎng)絡(luò)信息的位置,在Internet中,PoP( point-of-presence)位于不同ISP相互連接的位置,能夠直接獲取更多和更準(zhǔn)確的網(wǎng)絡(luò)信息,是部署網(wǎng)絡(luò)基準(zhǔn)點(diǎn)合適的地方。
3. 2 聚類算法
在已構(gòu)建的網(wǎng)絡(luò)坐標(biāo)基礎(chǔ)上,本文采用聚類方法來實(shí)現(xiàn)服務(wù)器部署.聚類是一門有著廣泛應(yīng)用的技術(shù),其目的是將一個(gè)數(shù)據(jù)集劃分為不相連的有相同屬性的簇,在許多方面都有著重要的應(yīng)用,包括K一均值算法(k-Means)和分層聚類算法(Hierarchical Clustering),其中,k-means算法的算法復(fù)雜度O( ktn)依賴于初始聚類質(zhì)心選擇,而分層聚類算法具有固定算法復(fù)雜度O(n2),與商業(yè)系統(tǒng)簡單穩(wěn)定的思想較為穩(wěn)合,故本文采用采用分層聚類算法,但O(n2)的算法復(fù)雜度在樣本數(shù)量巨大時(shí)顯然不適用,為此,文章利用網(wǎng)絡(luò)坐標(biāo)系統(tǒng)中樣本具有空間屬性這一特點(diǎn),先對樣本進(jìn)行初聚類,以減少樣本數(shù),從而達(dá)到降低系統(tǒng)運(yùn)算復(fù)雜度,算法流程如下所示:
1)將所有樣本所在的空間H均勻的劃分為perk個(gè)區(qū)域,計(jì)算每個(gè)區(qū)域的樣本數(shù)P和質(zhì)心點(diǎn)的坐標(biāo),即為P個(gè)初始樣本點(diǎn);
2)設(shè)初始時(shí)共有P個(gè)類,每個(gè)類由一個(gè)對象類成,令順序號m=0,L(m)=0;
3)在D中尋找最小距離d[(r),(s)]=mind[(i).,(J)];
4)將兩個(gè)類(r)和(s)合并成一個(gè)新類(r,s);另m=m+1,L(m)=d[(r),(s)];
5)更新距離矩陣D:將表示類(r)和類(s)的行列刪除,同時(shí)加入表示新類(r,s)的行列;同時(shí)定義新類(r, s)與各舊類(k)的距離為d[(k),(r,s)〕=min d[(k),(r)],d[(k),(s)];
6)反復(fù)步驟2-4,直到所有對象合并成k個(gè)類,并找出這k個(gè)類對應(yīng)的質(zhì)心位置坐標(biāo);
7)根據(jù)服務(wù)器部署成本和用戶體驗(yàn),每個(gè)區(qū)域中選擇合適的服務(wù)節(jié)點(diǎn);
8)分配服務(wù)器服務(wù)的用戶和需要的資源;
9)將邏輯節(jié)點(diǎn)按照服務(wù)用戶在物理位置的分布,進(jìn)行重新選擇,并最終得到服務(wù)器部署方案
上述算法同時(shí)考慮到用戶在網(wǎng)絡(luò)的密度分布、服務(wù)器部署成本和用戶體驗(yàn)(服務(wù)延遲)等3種因素,在該算法中,通過質(zhì)心選擇,實(shí)現(xiàn)了現(xiàn)實(shí)中服務(wù)器部署需要考慮的用戶分布密度,保證網(wǎng)絡(luò)流量的本地化,基于聚類的結(jié)果,算法在服務(wù)器選擇過程中,考慮了傳統(tǒng)服務(wù)器部署設(shè)計(jì)中的兩個(gè)主要因素:用戶體驗(yàn)和部署成本,如當(dāng)系統(tǒng)需要盡量保證用戶服務(wù)質(zhì)量時(shí),可選擇離質(zhì)心最近的網(wǎng)絡(luò)節(jié)點(diǎn)來部署服務(wù)器;當(dāng)系統(tǒng)設(shè)計(jì)者追求部署成本最低時(shí),可以選擇部署成本最低但離用戶較近的網(wǎng)絡(luò)節(jié)點(diǎn)來部署服務(wù)器,由于網(wǎng)絡(luò)坐標(biāo)僅考慮了不同用戶在網(wǎng)絡(luò)中的邏輯距離(延遲),因此,對網(wǎng)絡(luò)坐標(biāo)中的用戶采用聚類的方法來構(gòu)建的服務(wù)器部署屬于邏輯部署,而現(xiàn)實(shí)中的服務(wù)器部署則需要在具體物理位置放置服務(wù)器,這一過程則通過步驟9來完成。
4 部署性能驗(yàn)證
為了驗(yàn)證基于網(wǎng)絡(luò)坐標(biāo)服務(wù)器部署方案的可靠性和有效性,文章利用實(shí)際測量數(shù)據(jù)來網(wǎng)絡(luò)坐標(biāo)部署方案與傳統(tǒng)服務(wù)器部署方案的相關(guān)性能進(jìn)行了對比,在這里,針對不同服務(wù)器部署方法,文章用Ping測量數(shù)據(jù)來構(gòu)建網(wǎng)絡(luò)坐標(biāo),將TraceRoute測量數(shù)據(jù)用于傳統(tǒng)服務(wù)器部署方法,其中,基于Ping的測量過程利用了分布在全國13個(gè)地方的13臺服務(wù)器,服務(wù)器每兩小時(shí)自動(dòng)運(yùn)行一次,對130萬個(gè)有效IP進(jìn)行一次Ping測量,并記錄對應(yīng)的測量數(shù)據(jù)測量時(shí)間持續(xù)了一周,Paris-traceroute測量程序則運(yùn)行在中國22個(gè)省部署的30個(gè)服務(wù)器節(jié)中的228臺服務(wù)器上,然后通過這些服務(wù)器對130萬個(gè)有效IP做了為期3個(gè)月的TraceRoute的測量。
4.1坐標(biāo)基準(zhǔn)點(diǎn)選擇
圖2是幾種不同網(wǎng)絡(luò)基準(zhǔn)點(diǎn)在同一時(shí)刻的測量數(shù)據(jù)下構(gòu)建網(wǎng)絡(luò)坐標(biāo)的性能對比圖,該圖采用網(wǎng)絡(luò)坐標(biāo)構(gòu)建性能采用文獻(xiàn)4所采用的相對誤差,其中,實(shí)線是依照文獻(xiàn)的方法選擇出的5個(gè)網(wǎng)絡(luò)基準(zhǔn)點(diǎn),然后構(gòu)建的4維網(wǎng)絡(luò)坐標(biāo);單劃線表示依本文提出的網(wǎng)絡(luò)坐標(biāo)基準(zhǔn)點(diǎn)選擇原則選擇出的網(wǎng)絡(luò)坐標(biāo)基準(zhǔn)點(diǎn)構(gòu)建的4維網(wǎng)絡(luò)坐標(biāo);而雙劃線則是根據(jù)文獻(xiàn)[4]網(wǎng)絡(luò)坐標(biāo)選擇原則選擇出9個(gè)點(diǎn),并構(gòu)建的8維網(wǎng)絡(luò)坐標(biāo)。
圖2幾種網(wǎng)絡(luò)基準(zhǔn)點(diǎn)的網(wǎng)絡(luò)坐標(biāo)誤差累計(jì)分布圖
從圖2可以看出,9(8)網(wǎng)絡(luò)坐標(biāo)系統(tǒng)具有最好的準(zhǔn)確性,而依據(jù)本文提出的網(wǎng)絡(luò)坐標(biāo)基準(zhǔn)點(diǎn)構(gòu)建方式構(gòu)建的網(wǎng)絡(luò)坐標(biāo)系統(tǒng)雖然在準(zhǔn)確性上要低于9(8)坐標(biāo),但卻優(yōu)于利用同等網(wǎng)絡(luò)基準(zhǔn)點(diǎn)數(shù)量構(gòu)建的網(wǎng)絡(luò)坐標(biāo)系統(tǒng)。
圖3和下頁圖4顯示了基于網(wǎng)絡(luò)坐標(biāo)服務(wù)器部署方案的相關(guān)性能曲線,其中圖3展示了服務(wù)性能隨服務(wù)器部署數(shù)量變化趨勢,圖4顯示了部署成本隨服務(wù)器部署數(shù)量變化曲線,由圖3、圖4看出:
圖3聚類數(shù)量與響應(yīng)延遲間的關(guān)系曲線
圖4聚類數(shù)量與部署成本間的關(guān)系曲線
1)部署成本隨聚類數(shù)增加而增加,響應(yīng)延遲則隨聚類數(shù)量增加而減少,圖3和圖4都表明,無論在凌晨4時(shí)還是在晚上10點(diǎn),服務(wù)性能曲線都隨聚類數(shù)量增加而減少,部署成本則隨聚類數(shù)量增加而增加;
2)響應(yīng)延遲受網(wǎng)絡(luò)環(huán)境影響較大,而部署成本則受網(wǎng)絡(luò)環(huán)境變化不明顯,圖3表明,在任意時(shí)刻,晚上22時(shí)的響應(yīng)延時(shí)都位于凌晨4時(shí)的響應(yīng)延時(shí)之上,而圖4的兩天曲線則基本上重合,很難區(qū)分其優(yōu)劣。
圖5是在基于網(wǎng)絡(luò)坐標(biāo)的服務(wù)器部署方案下,服務(wù)性能與部署成本間的變化關(guān)系,顯然,服務(wù)性能隨部署成本增加而增加,且晚上22時(shí)的曲線變化更強(qiáng)烈因此,為了確保系統(tǒng)的服務(wù)性能,需要提高部署成本,這與現(xiàn)實(shí)生活中直觀印象較為穩(wěn)合,同時(shí),由圖5還可看出,雖然響應(yīng)延遲隨部署成本增加而減少,但二者不是線性關(guān)系,在部署成本較低時(shí),響應(yīng)延遲隨部署成本增加急劇下降,而當(dāng)部署成本增加到一定值時(shí),響應(yīng)延遲基本趨于穩(wěn)定因此,可以找出全局的最佳性價(jià)比部署方案,具體方法為:對部署成本一響應(yīng)延遲曲線求導(dǎo)數(shù),并取絕對值,找出最大的絕對值導(dǎo)數(shù)值所在的點(diǎn),即為最佳部署方案。
圖5部署成本與響應(yīng)延遲曲線
4. 2服務(wù)器部署性能
為了驗(yàn)證基于網(wǎng)絡(luò)坐標(biāo)服務(wù)器部署方案的有效性,文章比較了基于網(wǎng)絡(luò)坐標(biāo)部署方案的性能和傳統(tǒng)的服務(wù)器部署方案的性能,其中,傳統(tǒng)服務(wù)器部署模型式(2)所示:
由于上述服務(wù)器部署問題是一個(gè)NP-Hard問題,為了確保理論結(jié)果的準(zhǔn)確性,文章分別在Maflab中采用經(jīng)典的linear programming (LP)算法和直接使用lingo自帶的優(yōu)化算法等兩種算法來獲取結(jié)果,如表1所示。
表1的理論分析中,為了獲取完整準(zhǔn)確的網(wǎng)絡(luò)信息,節(jié)點(diǎn)間網(wǎng)絡(luò)延遲是通過Paris-uaceroute測量方法獲取的,對應(yīng)區(qū)域的用戶分布則采用CNNIC的2009年年度報(bào)告數(shù)據(jù),對比表1傳統(tǒng)理論模型的部署結(jié)果可知:無論是在部署點(diǎn)的選擇,還是部署成本和服務(wù)性能的估計(jì)中,上述兩種算法都相同,因此,有理由認(rèn)為基于傳統(tǒng)部署理論模型獲得的部署方案具有較好的準(zhǔn)確性。
表1基于網(wǎng)絡(luò)坐標(biāo)的部署方案和傳統(tǒng)部署方案性能對比表
對比表1中基于網(wǎng)絡(luò)坐標(biāo)的部署方案和基于傳統(tǒng)理論的部署方案,可以得出如下結(jié)論:
1)測量成本低:傳統(tǒng)服務(wù)器部署方案采用了228臺服務(wù)器,進(jìn)行了為期1個(gè)月的Paris-traceroute測量,而基于網(wǎng)絡(luò)坐標(biāo)的服務(wù)器部署方案只利用了5臺服務(wù)器進(jìn)行了為期一周的ping測量,可以看出,與傳統(tǒng)服務(wù)器部署方法相比,基于網(wǎng)絡(luò)坐標(biāo)的服務(wù)器部署方法投人成本更少,可以通過更少的網(wǎng)絡(luò)測量數(shù)據(jù)就能獲取準(zhǔn)確的網(wǎng)絡(luò)信息。
2)部署方案展現(xiàn)直觀:基于網(wǎng)絡(luò)坐標(biāo)的服務(wù)器部署方法可以通過圖的形式直觀表示出部署成本、服務(wù)性能(網(wǎng)絡(luò)延遲)和綜合部署成本隨最優(yōu)部署方法的變化曲線,同時(shí)實(shí)現(xiàn)傳統(tǒng)服務(wù)器部署理論中的facility location和k-median兩種模型的優(yōu)點(diǎn)。
3)取得優(yōu)化的部署部署性能:表1分別給出基于網(wǎng)絡(luò)坐標(biāo)的服務(wù)器部署在網(wǎng)絡(luò)條件最好和最差時(shí)刻的部署方案(包括部署成本、服務(wù)性能以及綜合性能等),理論分析給出相同備選節(jié)點(diǎn)情況下的服務(wù)器部署方案,可以看出,理論分析的部署服務(wù)性能要略優(yōu)于網(wǎng)絡(luò)最差情況下的基于網(wǎng)絡(luò)坐標(biāo)部署方案但劣于網(wǎng)絡(luò)最佳時(shí)刻的基于網(wǎng)絡(luò)坐標(biāo)部署方案(基于網(wǎng)絡(luò)坐標(biāo)服務(wù)方案選取的服務(wù)節(jié)點(diǎn)數(shù)為12,對應(yīng)的最小部署成本值為1,最大部署成本為1.6,最小響應(yīng)延遲為42ms最大響應(yīng)延遲為60ms理傳統(tǒng)部署方案則選擇13個(gè)部署點(diǎn),部署成本為1.65,響應(yīng)延時(shí)為55. 8ms)。
4)能在整個(gè)網(wǎng)絡(luò)中實(shí)現(xiàn)節(jié)點(diǎn)選擇:基于網(wǎng)絡(luò)坐標(biāo)確定了12個(gè)物理位置部署服務(wù)器,而基于傳統(tǒng)理論的部署方案則選擇了13個(gè)物理位置部署服務(wù)器,共同選擇的節(jié)點(diǎn)數(shù)為6,結(jié)合規(guī)律3可以看出,基于網(wǎng)絡(luò)坐標(biāo)部署方案能以較少的節(jié)點(diǎn)部署數(shù)量獲得優(yōu)化性能,即能實(shí)現(xiàn)服務(wù)器部署的全局優(yōu)化。
這一現(xiàn)象是由傳統(tǒng)理論分析中數(shù)據(jù)不完整造成的,在傳統(tǒng)部署理論分析過程中,為了獲得較完整的網(wǎng)絡(luò)信息,利用30個(gè)不同節(jié)點(diǎn)的228臺測試服務(wù)器,進(jìn)行為期3個(gè)月的數(shù)據(jù)測量,而部署理論構(gòu)建模型的求解時(shí)也以上述30個(gè)節(jié)點(diǎn)為備選服務(wù)節(jié)點(diǎn),顯然,這些備選節(jié)點(diǎn)不能覆蓋國內(nèi)所有區(qū)域,而基于網(wǎng)絡(luò)坐標(biāo)雖然僅僅利用5個(gè)節(jié)點(diǎn)作為網(wǎng)絡(luò)基準(zhǔn)點(diǎn),但通過網(wǎng)絡(luò)坐標(biāo)的計(jì)算,可以獲得全國范圍的邏輯網(wǎng)絡(luò)結(jié)構(gòu)信息圖,對應(yīng)的部署方案可以選擇出任意物理位置,原則上可以獲得全局的最優(yōu),如表1中基于網(wǎng)絡(luò)坐標(biāo)的部署方案包含三個(gè)傳統(tǒng)部署理論分析中備選節(jié)點(diǎn)之外的節(jié)點(diǎn)(陜西、云南和新疆),而在傳統(tǒng)部署理論分析過程中,只能從備選的22個(gè)節(jié)點(diǎn)選擇出最優(yōu)的部署方案,從而改變可能存在的最優(yōu)部署方案。
5 結(jié)論
服務(wù)器部署問題一直都是一個(gè)熱點(diǎn)問題,但傳統(tǒng)服務(wù)器部署存在網(wǎng)絡(luò)信息獲取不完整和搜索算法的效率隨樣本數(shù)量增加而急劇下降的缺陷,為了解決網(wǎng)絡(luò)信息獲取不完整的問題,本文引入網(wǎng)絡(luò)坐標(biāo)的測量方法,利用網(wǎng)絡(luò)坐標(biāo)方法來以少量測量成本獲得更完整的網(wǎng)絡(luò)信息,同時(shí),針對網(wǎng)絡(luò)坐標(biāo)系統(tǒng)的特性以及商用系統(tǒng)的特點(diǎn),引入分層聚類算法并加以改進(jìn),使之更適合服務(wù)器部署實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)的服務(wù)器部署方案相比,基于網(wǎng)絡(luò)坐標(biāo)的服務(wù)器部署方案除了能在網(wǎng)絡(luò)全局范圍內(nèi)獲得優(yōu)化之外,還具有測量成本低,且部署方案直觀等特點(diǎn)。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.oesoe.com/
本文標(biāo)題:一種新的服務(wù)器部署及其關(guān)鍵技術(shù)
本文網(wǎng)址:http://www.oesoe.com/html/support/1112158947.html