发表于

克服10G/40G/100G/400G数据中心迁移过程中出现的连接反射和网络故障问题


铜缆基础设施不可避免地要变得陈旧过时,并向10G光纤迁移以实现更高速率的以太网环境,这就给数据中心网络管理人员和工程代维公司带来了令人兴奋的机遇、挑战和棘手的任务。其中经常被忽略的一项棘手任务是连接反射,它可能导致严重的停机和网络故障,进而危及迁移的成功。通过使用合适的测试设备并改变目前的测试做法,采用更加面向未来的方法以应对连接方面出现的诸多变化,如并行光模块、PAM4、环形通量MMF和OM5宽带多模光纤(WBMMF)以及短波分复用(SWDM),我们可以轻松、迅速地解决一度被认为是严重的网络问题。

配线架处的连接反射——永久链路正发生变化

随着传输速度增加,尤其是40、100和400G的迫近,光纤插入损耗和连接反射要求必须变得更加严格。例如,从10G以太网向25G以太网的迁移会将每个通道上的吞吐量提高到原先的2.5倍,而选择25G线路速率来实现100G(4x25)链路可能会需要新的收发器。因此,一些主要的行业标准组织规定多模光纤的反射规格为-20dB反射规格(ISO/IEC 11801 2010;TIA-568.3D 2013),而单模光纤为-35dB UPC(TIA-568.3-D 2013,ballot 6),但有些人认为它们不足以满足要求。对于现有配备LC/UPC的配线架(和QSFP28 4x25G一起用于100G传输速率)来说,将多模光纤和单模光纤的反射规格分别定为-35dB和-40至-45dB可能会更加实际。反射阈值也应考虑到永久链路正发生变化,以实现高密度、可扩展的数据中心网,且越来越多地优化并行光模块,仅使用通过跳线直接连接发射器的多模MPO连接器。这种方法对于实现40-100G迁移以及未来的400G迁移非常理想,它使用带状光纤便于快速、轻松的安装,从而节省时间和人力成本。

MPO-MPO(40G-100G-400G)IEEE 802.3ba
图1:MPO-MPO(40G-100G-400G)IEEE 802.3ba

然而,用于单模和多模光纤的MPO连接器可能需要更严格的损耗容限。不同于SC和LC单模连接器,MPO连接器在多次连接和断开连接后可能更容易出现物理连接较差的情况,而这可能会造成连接器插入损耗和反射变差。对于多模光纤,Elite级(用于US Conec的MTP)或Ultra UPC,而对于单模光纤,APC(成角度物理接触)抛光可以帮助大幅减少反射问题。

修改数据中心里的反射和变化测试流程

数据中心基础设施在过去的几年里迅速发展,而光纤基础设施和收发器的发展路线图正变得越来越清晰。因此,运营商和工程代维公司目前正规划自己的带宽增长路线图。通过调查和研发,EXFO的工程师认识到宏弯在未来的几年里将影响网络基础设施部署和带宽迁移,并在此基础上设计和推出了测试设备来反映这些趋势与技术进步。趋势之一是很多超大型和其它大型数据中心仅采用单模光纤,同时讨价还价以便能够以好的价格购买昂贵的单模收发器。大型数据中心在其基础设施中充分利用PSM4和PAM4等新调制格式以及并行光模块,开始部署100G(4x25G),并计划在不久的将来部署200G和400G。

由于并非所有的数据中心都相同,因此我们观察到的另一个趋势是对于较小的企业数据中心来说,即使在MMF上实现100G/200G/400G传输的最大光纤距离被限制在60-70米,为安全迁移到200G/400G,多模仍是个好选择。TIA的TR-42工程委员会最近批准了OM5光纤,使在850nm区域内实现WDM(4波长)成为可能,并为证明多模光纤是一个可靠且面向未来的媒介提供了另一个范例。然而,满足新技术要求的成功方案,无论您喜欢与否,都需要新的测试做法和流程。

目前数据中心里一种常见的测试做法是首先使用OLTS(光损耗测试设备)为光纤互连基础设施评估重要的端到端损耗预算和光纤链路长度,以确保在特定应用中收发器能够成功传输信号。符合环形通量要求的OLTS,如MAX-945 iCERT QUAD,可以在不到3秒的时间里完成两个波长上的双向测试。然而,必须重新思考如何及何时使用OLTS进行测试,考虑包括损耗预算出现大幅度缩减(40G/100G多模光纤为1.5dB)在内的因素,从而准确评估光纤链路上的插入损耗分布情况或哪部分延伸到光纤盒和连接,而不是光纤本身。在测试10G部署、25G部署或未来100G/200G/400G部署的25G和/或50G通道时,损耗预算和净空的减少会成为一个更加复杂的问题,而且速率更高的网络要求更多的测试,包括配线架处的连接反射测试。而绕过测试这些系统,正如一些公司所做的那样,会导致本可以轻易避免的灾难性网络故障。

光纤链路损耗和多模反射的主要来源之一是光纤不匹配,造成在使用VSCEL时连接器出现偏移,使纤芯里的光线不足并低估损耗,或在测试时使LED满溢并高估损耗。研究表明,由于VCSEL容易造成纤芯里的光线不足,功率测量结果的变化幅度高达60%,导致不准确且随机性较高。为了实现可重复、一致、可再现且有效的测试结果,应使用环形通量指标和方法(如图2-4所示)。

VCSEL
图2:VCSEL

LED
图3:LED

环形通量
图4:环形通量

物理连接较差会导致较高的误码率、潜在丢包和延迟,因此建议使用符合环形通量要求的光源,如MAX-945 iCERT QUAD

无论何时,只要OLTS测试结果表明存在故障,问题出在连接器上的可能性都会超过95%。然而,OLTS不能评估或测量插入损耗或反射,也不能检测到问题的来源或有故障连接器的位置。而这是符合环形通量要求的OTDR,如 FTB-720C QUAD iOLM的任务,它可以在光纤链路上为每个连接器测量局部插入损耗和反射,并为所有输入和输出连接器精确定位故障,从而大幅减少停机。它还可以提供光纤链路总ORL、链路损耗和长度的相关信息。

由于反射是个非常严重的问题,因此合理的建议是首先使用OTDR进行测试,以确保所有的连接器都高效工作,从而保证能够一次性地完成向高速链路的迁移。接下来,通过OLTS测试来满足行业标准相关的合规性要求,并确保最佳的端到端物理基础设施传输性能。

影响回损的最常见原因之一是在安装和测试期间,技术人员的手或手指上的油污染了连接器(如图5所示)。在这里的单模示例里,油污导致回损出现很大的变化(10G时10dB至12dB)。在10G时,油污不会造成空气间隙,因此不影响插入损耗,但在25G时,回损可能非常大,以至于会由于误码率测试(BERT)性能的大幅降低,造成严重的网络故障。

清洁和有油污的连接器的回损比较(回损差平均为10dB-12dB)
图5:清洁和有油污的连接器的回损比较(回损差平均为10dB-12dB)

由于连接器上不允许有任何脏污、灰尘或碎片,因此每次在操作连接器时或在重新连接任何连接器前,必须使用FIP-435B光纤端面检测器来检测并清洁光纤,并进行OLTS或OTDR测试,以确保网络能够全天候正常运行。

未来就在眼前

随着带宽要求迅速增长以及网络向10G以上的速率迁移,未来已经来临。旧的10G连接和测试流程以及习惯已不再能够满足需要或经济合理。例如,继续运行有较旧的SFP的数据中心网,已不再可行,因为这会需要太多的光纤和10G活动端口。此外,链路在10G上平稳运行不能保证在现有的架构上100G/200G/或400G也能够正常运行;简单地假设它能正常运行会带来风险。同样也不能保证使用质量最好的元器件组建起来的新网络不会出现瑕疵、故障、损耗和反射。

要保证网络成功迁移并只需要很少的维护便可以实现不间断运行,最好的做法莫过于按照建议进行高效、频繁的测试,最终显著减少节省时间、人力成本和担心,因为您的网络会以最高性能运行。

OFS在过去的30多年里一直都是光纤测试和测量市场上的领导者,率先推出了用于数据中心的光纤设备,非常了解客户的需求和技术——了解程度之深,以至于EXFO涵盖整个光纤测试和服务保障环节的OLTS、OTDR和其它产品线都配备了下一代技术——在目前和未来的几年里都能够为您提供先进的测试设备和QoS/QoE。如欲了解最新测试解决方案的详情,敬请观看Nicholas Gagnon的按需CI&M网络研讨会演示