作者:盧艷軍
首先闡述了基于端到端的承載網絡性能測評的重要性和緊迫性,接著介紹了端到QoS測評的新方法,然后著重說明了端到端QoS測評新方法可解決運營質量治理中存在的諸方面問題,最后展望了網絡質量治理的未來。
1、網絡承載性能亟待測評
隨著ip網絡的發展,最初以承載為主要功能的IP網絡正漸漸地轉變為以增值業務運營為主要功能的網絡。業務的發展不斷給網絡提出更多的挑戰,業務流量的增加導致網絡負荷加重,網絡反應慢、鏈路帶寬不足、擴容投資不斷增長,網絡規劃和網絡質量治理缺乏可靠的依據和手段,測評現有網絡性能對新業務的支撐情況也屬空白??偠灾?,基于服務質量(QoS)的增值業務的運營難于開展,IP網絡承載性能狀況和對實時業務的支撐情況迫切需要在不影響業務運營的情況下進行測評、分析和治理。
業務對網絡性能的要求直接來源于業務對端到端客戶感知(主觀質量)的滿足程度的需求。尤其對于目前在網絡中涌現出的越來越多的實時業務,如VoIP、IPTV、VOD等業務對端到端的可用帶寬、時延、抖動和丟包十分敏感,這些性能參數嚴重影響著此類業務的開展和運營維護。這些指標的組合整體反映了承載網絡所能提供的QoS,因此準確把握這些網絡QoS指標是對網絡承載性能進行測評的基礎。
QoS是指網絡中多個環節共同提供的性能,包括路由隊列治理、應用層QoS保障、IP層QoS措施和鏈路層QoS保障。每一個環節的QoS所起的作用不同,對網絡QoS的影響也不同。
●路由隊列治理包括RED(RandomEarlyDetection)、ECN(EXPlicitCongestion Notificaiton)、FIFO(First-In First-Out)、Drop tail等隊列治理方法。這些方法直接作用在路由器上,對路由器的隊列緩沖區進行排隊治理。這些方法通過對數據的轉發優先級、丟棄優先級、丟棄概率和丟棄門限進行限定,對數據包的到達、排隊等待、轉發行為進行限制和處理,為數據包不同優先級、不同服務等級提供不同的行為規則。
●應用層QoS保障的實施依靠于應用本身的控制策略和措施。例如語音播放軟件的緩存機制、視頻誤碼掩飾機制都是基于應用層的QoS保障。
●IP層QoS機制是利用IP數據包頭信息進行包的路由選擇和轉發,包括利用ToS(TypeofService)字段信息確定服務類型和優先級,以及利用綜合服務、區分服務建立流轉發行為規則保證QoS。
●鏈路層QoS的保障是通過在鏈路層建立虛鏈路(如ATM中的虛通道)或定制鏈路層數據的轉發行為(如MPLS的包轉發控制)來實現質量分級。
但是,目前QoS治理無法在現有的IP網絡中保障業務的質量。這是因為目前網絡的QoS保障措施絕大多數是盡力型的而不是保證型的,而且幾乎所有QoS保障機制都是基于逐跳的行為控制的,而不是面向端到端的保障;另外,不同業務有不同的QoS要求,網絡提供服務質量的等級和業務的要求不是一一映射的關系,甚至是無法映射的。所以,業務的QoS保障成了目前服務提供商要解決的重要問題。然而,解決這一問題卻是一個工程技術界的難題,這將是一個漫長的過程。不過,對現有網絡的性能進行評估和質量分級治理是網絡運營迫在眉睫的事情。
2、端到端QoS測評的新方法
網絡QoS的評價指標主要包括可用帶寬、單雙向時延、單雙向時延抖動和單雙向丟包??捎脦捴苯佑绊懢W絡業務的質量、網絡對即將開展業務的支撐能力以及網絡的擴容規劃和設計。單向時延、單向時延抖動和單向丟包之所以不可缺少是由于業務服務器和客戶終端內容交互的非對稱造成的。IPTV、VOD等業務的質量好壞直接受媒體服務器到用戶終端之間單向鏈路性能質量的影響,而與另外一個方向的鏈路性能關系不大。所以單向端到端鏈路的性能質量指標要比雙向性能指標更能準確地反映網絡對業務的支撐能力和業務的真實服務質量。目前測評網絡性能質量的方法有很多種,不同方法存在不同的準確性和可靠性。傳統的網絡性能測試方法包括網管測量方法、儀表測試方法以及手工簡單測評。這幾類方法都存在一定的局限性,主要表現在一些性能指標無法獲取以及獲得這些指標需要依靠于路由器的配合,甚至影響正常業務的運營。下面將對傳統的方法和基于端到端網絡服務質量測試的方法進行分析和對比。
網管測量方法是通過對網元設備統計信息的采集獲得相應的QoS指標,如流量統計和丟包率。這兩個指標是網元設備的統計信息而不是端到端的性能信息,所以網管測量所得到的信息是單點設備的信息而不是業務所經鏈路整體的性能信息。單向時延、時延抖動以及單向丟包是網管系統無法得到的,因此網管系統基本上是無法進行網絡端到端質量測評的。
儀表測試方法雖然可以測量網絡的最大可用帶寬、時延和丟包,但是最大可用帶寬的測量采用傳統的“調波法”,這種方法利用儀表發生模擬數據包的方式,持續向鏈路中發送數據,直至鏈路完全被模擬數據占滿,從而得到鏈路的最大可用帶寬。顯然,它是不能在正常運營的業務網絡中進行測量的。單向時延和丟包的測量需要多臺儀表配合測量,而且不能得到真正準確的時延,這是因為多臺儀表之間時間同步和時鐘頻偏的問題無法真正得到解決。
其他手工方法,如用ping命令或tracert命令會受到防火墻和路由設置的限制而無法解決指標測量問題。即使沒有這些限制,這些命令結果反映的雙向時延也不能說明問題的本質,因為只有上下行兩個方向分別單獨測量的結果才能表明問題的真實情況。
要不影響正常業務運營的情況,測評網絡的性能質量狀態必須有更先進的技術和新的測量方法以達到對網絡狀態的真實反映。目前,在眾多企業和高校的技術人員的不斷努力下,終于找到一種有效解決這一問題的方法——基于端到端的網絡性能質量測試方法,它利用新奇的技術和高效的算法達到快速、準確地測試和測量的目的。
這種基于端到端測試的指標是端到端之間的指標而不是單個設備、某一段甚至某一跳之間鏈路的指標。端到端的含義包括業務的起始點和業務的終止點整條路徑,是業務傳輸的全部環節。
端到端的單向時延是從一個測量點(一個具體的IP地址)到另外一個測量點的數據報文傳遞所用的時間,這個時間是轉發時延、排隊時延和傳輸時延的總和。要實現對其準確測量必須要解決幾個問題,其中時鐘同步是一個基本問題,另外一個重要的問題就是時鐘頻偏和時鐘跳變的問題。也就是說,不僅需要解決時鐘基準問題,還要解決時鐘漂移問題。目前,此領域最新的單向時延測量的算法利用智能判定和模糊邏輯分析的方法可以較好地解決這一問題,使單向時延的測量成為可能。
端到端的可用帶寬也是分兩個方向分別來看的,目前大部分骨干以下的鏈路上下行兩個方向可用帶寬明顯不對稱,一般是下行大于上行,而在骨干以上及出口鏈路上兩個方向數據鏈路的可用帶寬比較接近。因此,區別不同方向的鏈路帶寬是必要的。如何得到不同方向的鏈路在不同的時段還有多少剩余的帶寬可供使用、是否擁塞、鏈路帶寬是否可以滿足當前業務和將來新業務的開展?要解決這些問題,就必須提供在不影響現有網絡業務正常運行的前提下可以測量可用帶寬的技術。傳統的“調波法”和網管的流量統計法存在影響業務、單點統計、統計粒度不夠精細等缺點使它們無法滿足現有網絡性能測試的要求。目前基于端到端的剩余帶寬測量方法采用了一種“微流量”測試的新方法,它通過向網絡中發送的數據流量(數據流量=鏈路帶寬×0.3%)即可完成對鏈路可用帶寬的測量。
基于以上兩種新技術就可以很輕易得到諸多新指標,如擁塞概率、網絡健康度等性能的評價指標,結合其他丟包率和時延抖動的分析即可構成相對完備的網絡QoS評價體系。
3、利用新方法解決運營質量治理中存在的問題
當前運營商在網絡運營中存在的諸多運維問題需要運用準確、高效的分析手段和解決方案來提高運營質量、客戶滿足度和ARPU值。從網絡功能的分類角度來看,這些問題主要集中在以下幾個方面:
●核心鏈路的性能監測和維護;
●接入鏈路用戶投訴;
●大客戶鏈路的服務等級保障和維護;
●業務專網的運營維護;
●支撐系統的維護治理。
不同的網絡面臨著不同的問題,從另外一個角度來看,這些問題又分為一些基本網絡維護、客戶QoS、新業務開展以及網絡健康度和規劃等問題。
3.1基本網絡維護問題
網絡的基本維護問題包括長期監視網絡可用帶寬、及時發現鏈路帶寬變化、定期監控不同方向鏈路時延和丟包情況以及擁塞情況。
這一問題可以通過端到端性能的測評定時提供測量結果和性能報告以及網絡現狀的監測和狀態的預警,發現網絡的瓶頸點和擁塞點。
3.2客戶QoS問題
客戶QoS是目前分級服務的主要內容,對于不同等級的客戶提供不同的鏈路帶寬、服務等級和QoS。那么,如何保證服務質量的承諾和迅速提供QoS的監控手段呢?
端到端性能測試可以測量客戶鏈路的可用帶寬,確保鏈路的可用性;測試鏈路的單向丟包和單向時延,確定鏈路對業務的支持情況;測量應用業務節點的響應時延,界定鏈路性能和服務器性能的故障和問題;通過擁塞定位和擁塞分析確定鏈路的薄弱環節,提供客戶鏈路質量的保障手段。
3.3新業務開展問題
對于新業務的開通,端到端網絡性能測試系統可以很輕松地對現有網絡的狀態進行測試和評估。首先,可以測試新業務部署點到不同訪問點單向鏈路的帶寬,確定現有網絡可用帶寬是否可以滿足新業務的需求;其次,測量單向時延、單向時延抖動和單向丟包,確定鏈路的性能是否滿足實時業務在時延方面的需求;最后,通過鏈路擁塞分析猜測鏈路的瓶頸環節,全面確保新業務的運營開通。
3.4網絡健康度和規劃問題
健康度是根據網絡多維性能的測評結果對網絡性能質量的整體評價,包括時延、丟包以及帶寬占有率多個性能指標緯度,如圖1所示,不同的指標緯度構成不同的質量區域,不同的區域反映了不同的健康狀態。
圖1 多緯度網絡健康度評價坐標系
3.5性能測試系統部署問題
為了實現對網絡性能質量的評估,基于端到端的網絡性能測試系統至少要具備兩種不同的形態以滿足不同需求。首先,針對需要解決業務開通測試和暫時性鏈路故障定位分析的情況,在骨干或核心網中部署單臺測試設備作為測量的一端,另一端用普通的PC遠程下載Agent即可實現端到端的測試;其次,對于需要長期監測的大客戶鏈路或業務專網,需要具備分布式測試和集中治理的能力,定時提供網絡健康狀況的報告。圖2描述了分布式監測集中治理的QoS監測系統,這個系統中包括前端設備(IPQoS-Agent)和中心控制治理單元(IPQoS-CCMU)。前端設備負責在多個對等體之間對鏈路性能進行測量以及對業務平臺服務響應進行測量,并將測試后的性能數據傳送給中心控制治理單元。而CCMU在存儲治理測試結果的同時,還負責對前端設備的控制和策略的調度。
圖2 QoS測試系統部署方案
4、網絡質量治理的未來
網絡的運營模式由粗放式帶寬租賃經營到精細化分級質量運營過程的轉變以及增值業務對網絡質量的不斷挑戰,使網絡質量的可度量化、可治理性、可運營性成為將來網絡運營維護治理的重中之重。因此,網絡性能質量測評手段是這一切的基礎,在這一基礎之上建立網絡質量測評體系是網絡高效運營的要害。
新聞熱點
疑難解答