找回密码
 注册

Sign in with Twitter

It's what's happening?

微信登录

微信扫一扫,快速登录

查看: 106|回复: 0

AI硬件系列报告—OCS光交换机:AI算力集群时代的新蓝海(附下载)

[复制链接]
发表于 2025-12-13 16:11 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
作者:微信文章
w1.jpg

1、什么是OCS光交换机?

什么是光交换机(OCS)?

光交换机(Optical Circuit Switch, OCS)指的是基于全光信号的交换机设备,其工作原理是通过配置光交换矩阵,从而在任 意输入和输出端口间建立光学路径以实现信号的交换。相较于电交换机,OCS无需光电信号转换和相应的数据包处理过程 ,可显著降低时延和功耗,系统故障概率也有所降低,且OCS无需进行端口速率的频繁迭代,通过单纯的光路重定向即可 实现跨代设备的无缝互联,可大幅提高硬件使用寿命。

电交换机(EPS)就像繁忙的邮局:当数据包(信件)抵达时,邮递员(交换机处理器)需要先读取地址信息(数据包头 ),再对信件进行分类,最后将其重新纳入邮件流继续传输。这种读取、分类和重定向的过程不仅会造成延迟,还会消 耗大量电能。这就是所谓的光-电-光转换。

光电路交换机(OCS)则如同自动化铁路调车场:当列车(光信号)抵达时,系统仅需重新配置物理轨道,即可创建从 起点到终点之间的直达且不间断的传输路径,无需开启车厢或读取内容,数据便能沿着专用物理线路以光速传输。这种 设计彻底消除了传统光-电-光转换过程中存在的延迟与能耗问题。

AI大模型持续迭代,Scale-Up/Scale-Out/Scale-Across场景催生OCS需求

AI大模型训练需要海量GPU/TPU协同计算,对通信传输带宽、时延、功耗提出了极高要求,而OCS技术凭借其高带宽、 低延迟、低功耗的特性,完美适配AI算力集群中Scale-up(例如:谷歌TPUv4集群)、Scale-out(例如:谷歌在Jupiter 架构引入OCS替代Spine层)和Scale-across(例如:英伟达DCI跨数据中心互联)对高效、灵活互联的核心需求。

OCS光交换机有哪几种技术路线?

光交换技术一般可分为MEMS、数字液晶、直接光束偏转 DLBS、硅光波导技术四类。 MEMS技术:系统由输入 / 输出光纤准直器阵列(FAU)和 MEMS 微镜阵列构成完整的 N×N 光开关矩阵。工作原理是 通过电信号精确控制镜的二维转角度,将输入光信号准导向目标出口。MEMS 微镜采用半导体工艺制造,镜面直径约数 百微米,主要采用静电梳齿驱动方式,通过调节偏置电压实现精确的角度控制。这是目前市场上的主流技术,市场份额 超过 70%,技术成熟度高,端口扩展能力强,具有性能与成本的均衡性。谷歌和 Lumentum 等厂商均以 MEMS 方案为 主。Lumentum 是谷歌 OCS 的关键合作伙伴,不仅是现阶段的供应商之一,还是谷歌下一代 OCS 方案的潜在整机提供 商。

OCS光交换机有哪几种技术路线?

数字液晶(DLC)/硅基液晶(LCoS)技术:利用外加电场改变液晶分子排列,从而影响入射光的偏振状态,再配合偏 振分束器来实现光路的切换。输入光会被分解为横向和纵向两个偏振分量,在光开关中分别进行处理,最后在输出端重 新合并。数字/硅基液晶方案无运动部件,成本较低;但其切换速度较慢,适用于无需频繁切换的场景。Coherent是该方 案的主要推动者,既有DLC又有LCoS技术方案布局,产品较为成熟。

直接光束偏转CLBS技术(又称压电陶瓷方案):利用压电陶瓷在电压控制下能够沿某一轴向发生尺寸变化的特性实现光 路的交换。该方案采用压电陶瓷驱动器直接控制光纤准直器的空间位置和角度,通过机电耦合效应产生微位移,使输入 输出端口的准直器实现精确对准。该技术光路简洁,传输损耗较低,但随着端口数增加,大角度对准时的机械位移需求 会制约扩展规模。该方案的主要推动者为Polatis。

硅光波导:在硅基芯片上构建出结构确定的光路矩阵,光信号沿着预设的路径传输。理论上其切换速度可以达到微秒甚 至纳秒级别。目前面临的主要问题是损耗较高,而且在多通道场景下容易产生串扰和可靠性问题。光波导方案适合高密 度集成应用,当前尚未大规模商用,主要由iPronics等公司推动。
2、AI数据中心需要多少OCS光交换机? ——以谷歌Scale-up场景为例

OCS是如何实现TPU Cube之间的互连的?

单Rack(又称Cube)包含64(4×4×4)个TPU v4芯片:单芯片采用3D环面拓扑结构,每芯片在网格中与其六个相邻 节点(上、下、左、右、前、后)相连,并在三个维度(X、Y、Z轴)上各自形成闭环。立方体内部的连接通过PCB及 铜缆实现,外部连接则使用光模块和OCS。

Superpod 特指仅通过ICI和OCS互联的最大TPU集群规模。 TPU v4 Super POD由64个Rack构成,实现4096(64×64 )个TPU v4芯片的互连。到TPU v7,Super POD集群有望 扩展至144个Cube,也就是9216个(144×64)TPU v7芯 片互连。

OCS是如何实现Cube间的互连的?

Cube内部通过铜缆背板、PCB进行极高速的电信号通信, 外部通过OCS走光纤链路。为了提供3D环面网络所需的环 绕链接,相对的两个面上的链接必须连接到同一个光电路交 换机。

TPU (4,1,4) 在Z+方向上没有内部相邻的TPU,因 此它将使用一个800G光收发器,通过光纤连接至分配给Z轴 的光路交换机(OCS),该OCS被配置为将此连接导向立 方体的Z-侧,从而连接到TPU (4,1,1)。

一个机架有6个外立面,每个外立面引出16条光互联链路, 合计96条光互联链路。64个机架,96*64=6144条光互联链 路;144个机架,合计13824(144*96)条光互联链路。

TPU v4集群采用136×136 端口配置(含 8 个冗余端口)的 OCS光交换机,故所需OCS数量为6144/(136-8)=48台; 而v7集群有望采用320×320端口配置(含32个冗余端口) 的OCS,故所需OCS数量为13824/(320-32)=48台。

即,4096个TPU v4组成的集群中,TPU数量和OCS光交换 机的比例约为85:1;9216个TPU v7组成的集群中,该比例 为192:1。

Google强势引领,全球OCS市场规模高速增长

根据QYResearch数据,2020-2025年全球OCS光交换机市场规模将由0.7亿美元增至7.8亿美元,5年CAGR达62%;预 计2031年全球OCS光交换机市场规模将达20.2亿美元,2025-2031年复合增长率达17.2%。全球范围内OCS光交换机生 产商主要包括Google、Huber+Suhner、Coherent、Calient、iPronics等。2025年,全球前四大厂商占有大约69.0%的市 场份额。
3、OCS光交换机产业链受益环节有哪些? ——以谷歌MEMS OCS为例

OCS产业链长,市场参与者多集中于单一环节

报告全文可扫描下方图片二维码进入星球社群查阅下载

w2.jpg

(报告来源:华安证券。本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
我们组建了研究报告知识星球社群,加入后您可以享受以下服务:1、星球中分享最新、专业、深度有价值的行业研究报告、投行报告、白皮书、蓝皮书、公司研报等。报告持续更新;2、会员可以用提问方式单独获取需要的报告,满足个性化需求;3、星球中海量研究报告PDF高清版,无限制下载;
4、4000+会员使用的研究报告宝库值得您信赖;
扫描下方二维码加入星球
w3.jpg

业务咨询、商务合作:136 3162 3664(同微信)
温馨提示

应广大粉丝要求,「报告研究所」成立了报告交流群,欢迎各位公司、企业、投行、投资机构、政府机构、基金、创业者朋友加入!
这里能且不限于:“每日分享多篇研究报告、行业交流、报告交流、信息交流、寻求合作等......”
入群方式:添加助理微信【touzireport666】,发送「个人纸质名片」或「电子名片」审核后即可入群。
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+1, 2025-12-16 10:29 , Processed in 0.093166 second(s), 31 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表