发表于

EtherSAM:以太网服务测试新标准——第1部分


随着以太网持续成为首选的传输技术,网络也将其重心从仅传输数据转向在互联的世界中提供各种娱乐和新应用。移动回传、商业和批量服务等基于以太网的服务需要承载各种应用,即语音、视频、电子邮件、网上交易和其它应用。这些新应用对网络性能和用来鉴定以太网服务性能的方法提出了新要求。

本文将探讨用于以太网服务开通、安装和故障诊断的ITU-T新草案标准EtherSAM或ITU-T Y.1564。EtherSAM是仅有的可通过一次测试更迅速地全面鉴定以太网服务等级协议(SLA),且精确度最高的标准测试方法。

网络现况

以太网目前传输实时和敏感服务。我们所说的服务指网络可承载的各种流量。总体而言,所有网络流量可分为三种类型:数据、实时和高优先级。每种类型的流量受网络特性的影响也不尽相同,且都必须进行梳理和整形,以满足各自的最低性能目标。

流量类型

主要应用

服务示例

数据

非实时或数据传输

  • 数据
  • 互联网接入
  • FTP下载/上传
  • 服务器、存储应用

实时

在丢失后不能重现的实时广播

  • VoIP
  • IPTV、视频点播
  • 互联网广播、电视
  • 网络游戏
  • 视频会议

高优先级

用于维持网络稳定性的必需数据

  • OAM帧
  • 交换/路由控制帧
  • 网络同步,如SyncE、1588v2

 

为确保服务质量(QoS),运营商需要正确配置自己的网络,规定如何确定网络内流量的优先级。为此,需要给每种服务分配不同的优先级并准确配置网络优先级算法。QoS实施指用来通过帧内特定字段区分不同服务流量,从而为某些帧提供优于其它帧的服务。通过这些字段,网元可以区分并服务高优先级和低优先级流量。

SLA的重要性

服务等级协议(SLA)是运营商与客户之间的有效合同,用以保证所提供服务能达到最低性能。这些SLA规定了主要的转发特性及每个特性的最低保证性能。

典型的SLA示例

流量类型

实时数据

高优先级数据

尽力而为数据
(互联网接入)

CIR (Mbit/s) (绿色流量)

5

10

2.5

EIR (Mbit/s) (黄色流量)

0

5

5

帧时延 (ms)

< 5

5-15

<30

帧时延变化 (ms)

< 1

n/a

n/a

丢帧(%)

< 0.001

<0.05

<0.05

VLAN

100

200

300

 

客户流量被划分为三个等级,且为每个等级指派一种颜色:绿色用于承诺流量、黄色用于超额流量而红色用于被丢弃流量。

  • 承诺信息速率(CIR)(绿色流量):指保证随时可为特定服务提供的带宽;对于绿色流量而言,要保证满足最低的性能目标(即关键性能指标或KPI)。
  • 超额信息速率(EIR)(黄色流量):指取决于网络负载和使用情况,可能提供高于CIR的超额带宽;对于黄色流量而言,不保证满足最低的性能目标。
  • 被丢弃流量(红色流量):指高于CIR或CIR/EIR速率、在不中断其它服务时不能被转发的流量;因此红色流量会被丢弃。
绿色流量 从0到CIR 保证转发 KPI受保证
黄色流量 从CIR到EIR 尽力而为 KPI不受保证
红色流量 > EIR或CIR 被丢弃流量 不适用

关键性能指标

关键性能指标(KPI)是具体的流量特性,显示特定流量配置的最低性能。

在流量为绿色情况下,网络必须保证所有转发的流量都满足这些最低性能要求。典型的KPI包括:

带宽

带宽指可转发的数据的最大数量。其测量结果表示在一秒的测量窗口内,被转发流量总和的比值。在采取不同的性能保障时,带宽可以是“承诺”值,也可能是“超额”值。

必须要控制带宽,这是因为多种服务通常会共享一个链路。因此,必须限制每种服务的带宽以避免影响其它服务。生成超过带宽限制的流量通常会导致帧缓冲、拥塞、丢帧或服务中断。

帧时延(延迟)

帧时延或延迟是数据包发送和接收时间之间的时延测量结果。通常情况下,它是一种往返测量,这意味着它要在近端至远端和远端至近端两个方向上同时测量。该指标对语音应用至关重要,因为延迟太高会影响呼叫质量,导致回音、通话时断时续甚至掉线。

丢帧

导致丢帧的原因有很多,如传输错误或网络拥塞。可能在传输帧的期间出现物理现象造成的错误,导致交换机或路由器等网络设备根据帧校验序列字段的比较结果丢弃某些帧。网络拥塞也会导致某些帧被丢弃,这是因为在出现拥塞时网络设备必须丢弃这些帧以避免使链路饱和。

帧时延变化(数据包抖动)

帧时延变化或数据包抖动指传输的数据包的到达时间变化。数据包在网络内传输时,经常会排队,以突发的形式传输到下一跳。可能会出现随机的优先安排,造成数据包以随机速率进行传输。因此,接收数据包的时间间隔没有规律。这种抖动会给端点节点的接收缓冲带来压力,在出现抖动大幅摇摆时,这些缓冲可能会使用过度或使用不足。

语音和视频等实时应用对数据包抖动尤为敏感。缓冲设计用来保存一定数量的视频或语音包,接下来这些视频或语音包会按照有规律的时间间隔进行处理,然后被流畅、无误地传送给最终用户。抖动过高会影响体验质量(QoE),因为以较快速率到达的数据包会导致缓冲溢出,造成丢包;而以较低速率到达的数据包会导致缓冲变空,造成图像或声音停顿。

流量类型

数据

实时流量

高优先级流量

带宽

非常敏感

敏感

敏感

丢帧

非常敏感

非常敏感

非常敏感

帧时延

敏感

敏感

敏感

帧时延变化

不敏感

非常敏感

不敏感

现有的测试方法:RFC 2544

RFC 2544是应用最广泛的以太网服务测试方法。该系列子测试可提供测量吞吐量、往返延迟、突发和丢帧的方法。

它刚推出时作为网络互连设备实验室基准测试方法。然而,由于RFC 2544能够测量吞吐量、突发、丢帧和延迟,且因为它是现有的唯一标准测试方法,它也用于在现场测试以太网服务。

虽然这种方法能够为鉴定网络提供关键参数,但它不足以全面验证当今的以太网服务。更具体的说,RFC 2544不包括所需的全部测量结果,如数据包抖动、QoS及多个并发服务的等级。此外,由于RFC 2544需要先后进行多次测试才能全面验证SLA,所以该测试方法需要花费好几个小时,对于运营商而言既耗时又费钱。现在,需要模拟在网络上运行的各种服务并同时鉴定每种服务的所有关键SLA参数。

革命性的测试方法:EtherSAM(ITU-T Y.1564)

为了解决现有测试方法的问题,ITU-T推出了一个新的测试标准:ITU-T Y.1564,它针对现有的以太网服务要求而开发。EXFO率先在其以太网测试产品中实施了基于该新标准的以太网服务测试方法EtherSAM。

EtherSAM可通过一次测试全面鉴定所有的SLA参数,以确保最佳的QoS。相比其它方法,它可以支持新的多服务产品。事实上,EtherSAM可以模拟网络上运行的所有类型的服务并同时鉴定各种服务的所有关键SLA参数。它还可以验证网络中部署的QoS机制,为不同服务类型排列优先级,从而使验证更准确,部署和故障诊断更快捷。此外,EtherSAM还提供其它功能,如双向测量。

EtherSAM(Y.1564)的开发基础是大部分服务问题出现在两个不同的方面:(1)承载服务的网元配置;或(2)多个服务导致拥塞,负载较高时的网络性能。

网络配置

交换机、路由器、桥接器和网络接口单元等转发设备是任何网络的基础,这是因为它们将网络的各个部分互连起来。这些转发设备的配置必须正确,以确保流量能够根据其服务等级被充分梳理和转发。

如果没有在端到端路径的某个设备上对服务进行正确配置,网络性能会受到极大影响,因为服务可能无法正确实施。这可能会导致服务中断和整个网络问题,如拥塞和链路故障。因此,很重要的一部分测试工作就是确保设备的配置正确,从而按照要求承载网络流量。

服务性能

服务性能指网络在不降低性能的条件下,以保证的最大速率承载多种服务的能力;也就是说KPI必须保持在可接受的范围内。

在网络设备承受负载时,必须做出质量决策,让某个流量的优先级高于另一个流量,以满足为每个流量等级设置的KPI。在只有一个流量等级时,网络设备不进行优先级划分,因为只有一组KPI。在流量增加时,必需进行优先级划分,且可能会出现性能故障。

必须进行中长期服务性能评估,因为从长远来看,通常会出现问题,且无法通过短期测试发现这些问题。

因此,EtherSAM(Y.1564)的重点有三个:

  • 首先,该方法作为鉴定工具,确保网络满足SLA要求,方法是确保速率不同且在承诺速率范围内的情况下,服务满足其KPI性能目标。
  • 其次,该方法确保网络传输的所有服务在最大承诺速率时满足各自的KPI目标,从而证明在最大负载情况下,网络设备和通路可按照设计要求,支持所有的流量。
  • 再次,可进行中长期服务测试,以确认网元在持续承受压力的情况下能够正确承载所有服务。

EtherSAM:测试和子测试

EtherSAM包括两种测试:网络配置测试和服务测试。

网络配置测试

网络配置测试是一种单服务测试,按照用户的规定,验证某个服务的带宽和性能要求。该过程包括三个主要阶段,并在各个阶段监测所有的性能指标,以确保同时满足这些指标。

第1阶段:从最低数据速率到CIR

在该阶段,特定服务的带宽逐渐从最低数据速率增加到承诺信息速率(CIR)。这可以确保网络能够在不同数据速率下支持这种服务,并维持性能水平。它还提供了一种能够安全、有效地增加网络利用效率,且在服务配置不正确时不会造成网络超载的方法。

在服务带宽逐渐增加到CIR时,系统在每一步都会自动测量KPI,确保始终满足最低性能目标。如果未达到任何性能指标,该阶段测试也未通过。要通过这一阶段测试,必须在每一步增加速率,直至CIR时都满足所有的性能指标。

Minimum data rate to CIR

- 在增加服务速率时,测量KPI(Rx吞吐量、丢帧、帧时延、帧时延变化)

通过/未通过标准

通过
  • KPI在SLA范围内
未通过
  • 任何KPI都未通过

第2阶段:从CIR到EIR

在该阶段,将服务速率从CIR逐渐增加到超额信息速率(EIR)。这可以确保服务的EIR配置正确,且可达到该速率。然而,根据公认的准则,在速率为EIR时,性能得不到保证;因此,没有评估KPI。

在这个阶段,系统仅监测接收的吞吐量。由于EIR得不到保证,因此可能无法为所有超过CIR的流量提供带宽。如果接收的最低速率为CIR,而最高速率可能为EIR,则认为测试通过。如果测得的任何速率低于CIR,则认为测试未通过。

CIR to EIR

- 以EIR测试服务。由于这代表黄色流量(无性能保障),因此不评估KPI。只为接收的吞吐量建立通过/未通过条件。虽然未保障EIR,但CIR应该代表测得的最小吞吐量。

通过/未通过标准:

通过
  • Rx速率大于或等于CIP,最高达到EIR
  • CIR ≤ Rx速率 ≤ EIR
未通过
  • Rx速率小于CIR

第3阶段:过冲测试

分组传输的特点之一是能够处理突发流量。在突发、过冲或超过可用带宽的情况下会发生EIR,这通常导致流量被丢弃。

在这一步中,以超过EIR的速率发送流量,并监测接收速率。至少必须转发CIR。如有可用资源,应转发EIR流量。应丢弃任何超过这个最高值的流量,以避免网络超载。如果接收的流量超过EIR,意味着某个设备的配置不正确,并表示测试未通过。

Overshoot testing

- 以超过EIR的速率测试服务这对应红色流量,预计会丢弃某些流量。对带宽进行通过/未通过测试,确保对服务进行正确的速率限制。

- 如果任何接收到的吞吐量超过EIR,则表示服务的配置不正确。

通过/未通过标准:

通过
  • Rx速率大于或等于CIP,最高达到EIR
  • CIR ≤ Rx速率 ≤ EIR
未通过
  • Rx速率小于CIR或大于EIR

 

每种服务需要经过这三个阶段,因此,如果网络上存在多种服务,应先后测试每种服务。这可以确保没有其它数据流的干扰,且具体测量服务的带宽和性能。

在以太网网络配置测试的最后,用户可清楚评估网元和通路是否正确配置以转发服务,并满足最低的KPI性能指标。

服务测试

网络配置测试主要关注每种服务在网元内的配置是否正确无误,而服务测试则关注承诺流量情况下的QoS参数实施情况,模仿实际服务。

在该测试中,以相同的CIR同时生成配置的所有服务,持续一段时间(从几秒钟到几天不等)。在该阶段,分别监测每种服务的性能。如果任何服务未能满足性能参数,则表示测试未通过。

Service test

- 同时以最大速率生成所有配置的服务,且保障性能。

- 监测所有的KPI。如果任何服务的KPI低于最小性能指标,则表示测试未通过。

通过/未通过标准:

通过
  • 所有服务的KPI都在各自的最小性能指标范围内
未通过
  • 任何KPI低于最小性能指标

 

这两种测试结合起来,便可通过简单、完整的测试方法提供所有的关键结果。它通过网络配置工具,关注每种服务,以及路径上的网元如何应对每种服务,从而迅速发现配置问题。该测试关注网络同时应对并保证各种服务的能力。在通过这两个阶段测试后,电路可以随时激活并投入使用。

EtherSAM测试拓扑结构:环回和双向(双测试设备)

EtherSAM还可通过环回设备进行往返测量。在这种情况下,结果反映从测试设备到环回点再返回测试设备这两个测试方向的平均值。在该情景中,可由处于环回模式的另一台测试设备或网络接口设备来执行环回功能。

也可以在双测试设备模式中进行相同的测试。在这种情况下,将一台测试设备指定为本地设备,另一台设备为远程设备,用于交换数据并各自在每个方向上独立进行测试。这可以提供更精准的测试结果,如独立评估每个方向,并能够迅速确定链路的哪个方向出现故障。

Loopback and bidirectional testing