点击上方网络技术干货圈,选择设为星标
优质文章,及时送达
在过去几十年里,数据中心交换机主要依赖电信号通过铜线进行数据传输。然而,随着数据传输速率从100Gbps向400Gbps、800Gbps甚至1.6Tbps迈进,传统电互联(Electrical Input & Output, EIO)面临三大瓶颈:信号衰减、功耗激增和空间限制。例如,高速信号在长距离铜线传输中会产生严重的信号失真,迫使设计者加入数字信号处理器(DSP)来补偿信号衰减,这进一步推高了功耗和成本。此外,传统可插拔光模块的体积较大,限制了端口密度,难以满足现代数据中心对高带宽密度的需求。
光互联技术的出现为这些问题提供了解决方案。与电信号相比,光信号具有低损耗、长距离传输和高带宽的天然优势。通过将光电转换技术集成到交换机中,OIO、OBO、NPO和CPO等技术在不同程度上缩短了电信号传输距离,降低了功耗,同时提升了带宽密度。这些技术的核心在于如何将光引擎(Optics Engine)与交换芯片(ASIC)更紧密地集成,从而优化性能。
四种光互联技术
1. OIO(Optical Input & Output,光输入输出)
OIO是一种广义的光互联技术,旨在通过高带宽、高密度的光接口解决交换机芯片、CPU、GPU等大容量芯片的输入输出瓶颈。它并非单一的产品形态,而是涵盖了OBO、NPO、CPO甚至未来的OEIC(Optics Electronic Integrated Circuit,光电集成电路)等一系列技术。OIO的核心是将光信号直接用于芯片间的通信,取代传统的电信号,从而突破铜线传输的物理限制。
OIO的典型特点是其高密度和超高带宽。根据IPEC(国际光电委员会)的研究,OIO有望提供比传统EIO高100倍的通道密度,每个通道的带宽也能提升100倍以上。例如,OIO可以通过微环调制器(Micro-Ring Modulator, MR)利用多个波长(WDM)传输数据,实现低功耗、高密度的互联。这种技术尤其适合AI驱动的场景,如GPU集群间的超高速通信。
高带宽密度:OIO的总带宽可达40Tbps,带宽密度高达5Tbps/mm,能效低至3pJ/bit,远超其他光互联技术。 低功耗:通过减少或消除DSP的使用,OIO显著降低了信号处理功耗。 长距离传输:相比电互联,OIO的信号传输距离更长,适合跨板、跨机架甚至跨数据中心的通信。 灵活性:OIO可以与计算芯片(如GPU)或交换芯片联合设计,适应多种应用场景。
OIO的优势在于其超高的性能潜力,特别适合AI训练和推理等需要大规模数据传输的场景。例如,NVIDIA的GB200芯片拥有1.8TB/s的片间带宽,未来可能通过OIO实现光通信的支持。 然而,OIO的技术落地难度较高,需要与计算芯片进行联合设计和优化,涉及复杂的物理层和协议层创新。此外,OIO的标准化和产业链协同仍处于起步阶段,短期内难以大规模商用。
OIO主要应用于服务器内部的芯片间通信,例如GPU与GPU、CPU与存储芯片之间的数据传输。它是未来100Tbps以上交换芯片和AI集群的核心技术,预计到2033年市场规模将从500万美元增长到23亿美元。
2. OBO(On-Board Optics,板载光学)
OBO是一种将光引擎安装在与交换芯片ASIC相同的PCB板上的光互联技术。与传统可插拔光模块(Pluggable Optics)相比,OBO将光模块的关键组件(如光引擎和电引擎)围绕ASIC排列,缩短了芯片与光引擎之间的电信号传输距离(通常在15-20cm)。OBO通过PCB走线连接ASIC和光引擎,减少了信号衰减和寄生效应。
OBO最早由COBO(Consortium for On-Board Optics)联盟提出,目标是提升带宽密度并改善电气性能。其典型产品包括支持8通道或16通道的板载光模块,每通道速率最高可达56Gbps。
中等集成度:OBO将光引擎从面板移到PCB上,缩短了电信号传输距离,信道损耗控制在15dB以内。 多模光纤支持:OBO多基于多模光学技术,适合短距离传输(通常在100米以内)。 灵活性与可维护性:OBO保留了部分可插拔特性,光引擎可以通过连接器更换,维护成本较低。
OBO的优势在于其技术成熟度和开放性。相比CPO,OBO的产业链更成熟,易于实现多厂商供应,降低了供应链风险。此外,OBO的维护较为简单,适合需要频繁更换光模块的场景。然而,OBO的带宽密度和功耗优化能力不如NPO和CPO,难以满足超高速率(1.6Tbps以上)场景的需求。
OBO适用于对带宽密度要求较高但不追求极致功耗优化的场景,如中小型数据中心的接入层和汇聚层网络。它是可插拔光模块向更高集成度技术过渡的中间形态。
3. NPO(Near Package Optics,近封装光学)
NPO是OBO的进一步演进,将光引擎放置在与ASIC相邻的高性能基板上,集成度更高。NPO通过高性能基板连接ASIC和光引擎,电信号传输距离进一步缩短至约150mm,信道损耗控制在13dB以内。 国内厂商锐捷网络在2021年推出了全球首款25.6T NPO冷板式液冷交换机,并于2022年展示了51.2T概念机,标志着NPO技术的商用落地。
NPO通常采用硅光技术,通过光纤阵列单元(FAU)实现光信号的输入输出。它支持外置激光源(ELS),提高了系统的灵活性和可维护性。
高集成度:NPO的光引擎与ASIC的距离更近,功耗和信号完整性优于OBO。 硅光技术支持:NPO多采用硅光光引擎,与CMOS工艺兼容,成本较低。 开放生态:NPO的光引擎和交换芯片解耦,支持多厂商供应,产业链成熟度较高。
NPO在功耗、带宽密度和可维护性之间取得了较好的平衡。相比CPO,NPO的实现难度较低,且保留了部分可插拔特性,便于维护。例如,锐捷网络的51.2T NPO交换机支持64个800G端口,并兼容400G端口,展示了其灵活性。 然而,NPO的电信号传输距离仍较长,功耗优化潜力不及CPO,且在超高带宽场景下可能面临瓶颈。
NPO适合需要高带宽密度和低功耗的场景,如大型数据中心的骨干网络和AI集群的L1/L2层交换机。它是CPO大规模商用前的过渡技术。
4. CPO(Co-Packaged Optics,共封装光学)
CPO是将光引擎与交换芯片共同封装在同一基板上的技术,电信号传输距离缩短至50mm以内,信道损耗控制在10dB以下。 CPO通过硅光集成技术将光电转换单元小型化,与ASIC紧密集成,通常采用TSV(Through Silicon Via)或interposer等先进封装技术。CPO的典型产品包括Broadcom和Marvell的51.2Tbps交换芯片,支持100Gbps或200Gbps单通道速率。
CPO的目标是通过极高的集成度实现低功耗、高带宽和低延迟。LightCounting预测,CPO端口的销售量将从2023年的5万增长到2027年的450万,增长潜力巨大。
超高集成度:CPO将光引擎与ASIC封装在同一插槽内,极大缩短了电信号传输距离。 低功耗:CPO系统功耗可比可插拔光模块降低50%以上,适合AI超算场景。 高带宽密度:单模块带宽可达1.6-3.2Tbps,带宽密度为50-200Gbps/mm。 硅光引擎:CPO多采用基于马赫-曾德尔调制器(MZ)的硅光引擎,支持高精度信号调制。
CPO的优势在于其卓越的功耗和带宽性能。例如,NVIDIA的Quantum-X800平台推出的Q3450-LD交换机支持144个800Gbps InfiniBand端口,功耗比传统光模块低3.5倍,网络可靠性提高10倍。 然而,CPO的挑战在于其高度集成导致维护困难。一旦光引擎或ASIC故障,需要更换整个封装模块,增加了运维成本。此外,CPO的供应链高度集中,可能导致厂商锁定,限制多源供应。
CPO主要应用于高性能计算(HPC)和AI超算场景,如InfiniBand交换机和以太网交换机。它适合需要极低功耗和超高带宽的L1/L2层网络,但在可维护性和成本优化方面仍需改进。
四种技术的对比
技术 | 集成度 | 电信号距离 | 功耗 | 带宽密度 | 可维护性 | 应用场景 |
---|---|---|---|---|---|---|
1. 集成度与功耗
OIO的集成度最高,几乎消除了电信号传输,功耗最低,但技术复杂。CPO次之,功耗比可插拔光模块低50%以上。NPO和OBO的集成度依次降低,功耗优化效果也随之减弱。
2. 带宽密度
OIO的带宽密度遥遥领先,适合未来100Tbps以上场景。CPO和NPO的带宽密度较高,分别支持51.2Tbps和25.6Tbps交换机。OBO的带宽密度最低,适合中低速场景。
3. 可维护性
OBO的可维护性最高,保留了可插拔特性。NPO通过解耦设计提供了中等可维护性。CPO和OIO由于高集成度,可维护性较差,故障更换成本高。
4. 产业链成熟度
OBO和NPO的产业链较为成熟,支持多厂商供应。CPO的产业链集中于少数厂商(如Broadcom、Intel),存在供应锁定风险。OIO的产业链尚在起步阶段,需进一步协同。
---END--- 重磅!网络技术干货圈-技术交流群已成立 扫码可添加小编微信,申请进群。 一定要备注:工种+地点+学校/公司+昵称(如网络工程师+南京+苏宁+猪八戒),根据格式备注,可更快被通过且邀请进群 ▲长按加群
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...