时间: 2024-12-22 14:45:43 | 作者: 华体会app怎么样
。1)长久来看,LPO 具有低功耗、低延迟、低成本和可热插拔等优势,硅光方案能够给大家提供更好的线)CPO 将光芯片与交换芯片在基板上封装在一起,逐步降低功耗,提高带宽,为满足 CPO 的要求,需要开发先进的硅光子制造技术和元件结构;3) OIO 主要为实现低功耗、高带宽、低延迟的光互连,仍处于行业早期阶段,有望加快速度进行发展,硅光技术可能是 OIO 的唯一光学解决方案。
Blackwell GPU 包含2080 亿个晶体管,采用定制的台积电 4NP 工艺制造,由两个尺寸接近掩模版极限的GPU 芯片组成,通过 10 TB/s 的芯片到芯片链路连接到单个统一的 GPU 中,并配备 8 个 HBM3E 内存,HBM 容量为 192 GB,内存带宽达 8 TB/s。Blackwell GPU 的AI 性能是上一代Hopper 的5 倍,片上存储容量是 Hopper 的4 倍。于GTC 2024,英伟达推出Blackwell GPU,该芯片包含两个die,通过 10TB/s 的芯片到芯片互连连接,这代表每一侧 die 都可以像“两个芯片认为它是一个芯片”一样工作。Blackwell GPUAI 性能达 20 PetaFLOPS,专为训练 10 万亿参数级的 AI 大模型而设计。根据英伟达,Blackwell 仅需Hopper 1/25 的成本,且功耗更低。预计在2026 年发布的 Rubin AI 平台将使用 HBM4 和 NVLink 6 Switch,工作速度可达 3,600GBps,2027 年英伟达将发布迭代产品“Rubin Ultra”,尽管还并未提供即将推出的产品的详细规格,但英伟达指出新芯片组将在成本和能耗方面有所节省。
光模块的主要应用场景与交换机密切相关,光模块的速率和需求规模与交换机有直接的对应关系。在AI 算力基础设施中,光模块大多数都用在服务器与交换机之间以及交换机与交换机之间的高速连接,因此除了 AI 服务器内 xPU 的接口互联需求以外,交换机的互联需求也会直接决定光模块的速率和用量规模。
NVIDIA Quantum-X800 InfiniBand 交换机为英伟达目前最新的IB 交换机系列新产品,使用ConnectX-8 800G 网卡,提供 800 Gb/s 的吞吐量、超低延迟、先进的 NVIDIA 网络内计算以及提升高性能计算(HPC) 和AI 数据中心整体应用性能的功能。通常InfiniBand 所需的主要硬件设备为网卡、连接线缆和专用的 IB 交换机,而连接线缆又包括光模块和线缆两部分。其中光模块是数据传输的重要器件之一,是可热插拔的网络接口模块,用于连接网络交换机和其他网络设备(如服务器)的数据传输。因此,新一代交换机的发布,有望带动相应高速率光模块的需求进一步提升。
预计 2026 年发布的Spectrum-X1600 将使用 ConnectX-9 SuperNIC 网卡,对应光模块端口速率也有望升级到1.6T。随着交换机产品不断加速升级迭代,交换机速率日益提高,对应使用的光模块速率也将不断的提高,有望进一步拉动高速率光模块需求。
以太网在 AI 市场的渗透率提升,叠加推理需求快速释放,2025 年的 800G 光模块指引有望显著增长。
除英伟达在全面布局和推进以太网在AI 领域的应用外,传统的以太网供应链头部企业博通也同样积极把握以太网方案渗透率提升的机遇,目前全球部署的 8 个最大的 AI 集群中有7 个使用博通的以太网解决方案,而且博通预计明年开始所有超大规模的 GPU 集群都将基于以太网部署。根据中际旭创披露信息,未来 AI 推理需求的迅速增加,带来数据流量及带宽需求的迅速增加,同时伴随 51.2Tb/s 交换机芯片的日趋成熟和接受大量预订,H 系列芯片、以太网交换机以及与之配套的 800G 光模块将共同构建用于推理或训推一体的 AI 数据中心网络,因此行业客户的2025 年800G 需求指引,相比2024 年有较为明显的增长。
AI 算力的核心是 GPU,而英伟达提升到一年一迭代的节奏,将拉动 NvLink、IB、以太网等网络连接解决方案的提速,进而对光互联的关键器件光模块释放长期持续的更新迭代需求。特别是行业对以太网方案具有更广泛的应用基础,随着以太网在 AI 的应用场景得到不断的拓展,将有望释放包括高速光模块在内的硬件设施需求,有望带动高速率光模块市场规模的持续增长。根据 Coherent预测,由于 AI 的繁荣,数据通信市场已出现拐点,800G、1.6T 将在未来 5 年占据主导地位,800G、1.6T 需求或将经历快速上升阶段,并将具有较长的重叠周期,Coherent预计未来五年 800G 及以上光模块的复合年增长率预计将达到 60%。
解决数据传输速率提升问题的同时,也一定得面临增加的功耗和成本所带来的挑战。根据 Cisco 官网,达到 400G 和 800G 阶段,光模块的功耗飞速增加,占整个设备总功耗的 40%或更多。与 2010 年相比,2022 年的总功耗增加了 22 倍。光通信设施能源消耗的增加给整个数据中心的能源利用和成本带来了巨大负担。
硅光方案有望大大降低光模块功耗。此外,我们大家都认为硅光更适合于 LPO、CPO、 OIO 等新产品技术相结合,能够更有效地较低功耗。
1、 线性直驱(LPO)和性接收光学器件(LRO):有望快速产业化的低功耗/成本方案
性驱动可插拔光器件(LPO)是一种可插拔光学模块,其内部没有数字信号处理器(DSP),而是依靠模块发端的驱动器所提供的某些特殊功能和性能实现。具有高线性度的驱动器芯片作为核心部件,通过线性直驱技术取代传统的 DSP,以此来实现降低功耗、减少相关成本和减少延迟。LPO 方案优势显著。1) 低功耗:
LPO 功耗相较带 DSP 的光模块下降 50%,与CPO 接近。不仅节省电能,且能减少模块内组件的发热,降低系统散热功耗。2)低延迟:去掉 DSP 芯片后,系统减少了对信号复原计算的时间,延迟大幅度降低。相比DSP 100ns 级别的延迟,LPO 光模块能做到皮秒级别的超低延迟时间。3)低成本:LPO 的 Driver 和 TIA 里集成了更强大的线路补偿 EQ 功能,电芯片成本会较之前少许上浮,但由于不再采用 5nm/7nm 先进晶圆制造工艺的 DSP 芯片,系统成本得以降低。4)可热插拔:相比于 CPO,LPO 没有显著改变光模块的封装形式,采用可插拔形式,不改变当前用户使用习惯,快速插拔,维护方便。除了 LPO 之外,各厂商都在寻找逐步降低功耗和成本的创新方案, TRO 等 half LPO 方案成为了市场上新的关注点。线性接收光学器件(LRO)作为一种折衷方案引起人们的关注,即在发射端(Tx)使用重定时器(retimer),线性接收器直接驱动到主机 ASIC。该方案虽然在降低功耗或成本上逊色于 LPO,但与完全重定时的模块相比,仍然起到了降低模块功耗和一定成本的作用,同时还能为链路提供一些诊断支持。在 OFC2024 上,旭创现场演示 1.6T-LPO-DR8 OSFP 模块,并基于 Arista 51.2Tbps 交换机现场演示800G-LPO-2xDR4 OSFP。
线性驱动可插拔光学器件(LPO),去除DSP 或CDR,可大大降低功耗和时延,对于 ML 及HPC 中的交换机到交换机、交换机到服务器以及 GPU 到 GPU 连接等应用至关重要。LPO 将可用于多模(VCSEL)和单模应用(EML、SiPh),但与线性调制器(如 TFLN、BTO 和与 SiPh 结合的 Organics)配合使用效果最佳。根据 Yole 预测,LPO 的技术生态系统已准备就绪, 100G SerDes 已集成到最新的网络交换芯片中,OFC 2024 会议重点讨论了适用于 1.6T (8x200G)应用的线性接收光学器件(LRO),该器件可提高性能和鲁棒性。
随着数据中心传输速率不断的提高,传统光模块信号损耗问题日渐突出。传统光模块独立于交换芯片之外,通过铜缆或光纤与其他电子组件相连,这种方式在高速信号传输过程中易产生较大的功耗和信号损耗。
随着 DCI 等网络速率逐渐从 400G 发展到 800G、 1.6T,单个光模块的功耗也在增加。此外由于光模块在交换芯片之外,导致此方式的电学互连走线较长,表现出明显的寄生效应,存在信号完整性问题,且模块的体积较大、互连密度低,已不足以满足大带宽、高传输速率和日益剧增的算力的需求。
CPO 为芯片封装级别的光学组件集成新技术,有望通过缩短光信号输入和运算单元之间的电学互连长度来减少信号损耗问题。
光电共封装(CPO,Co-packaged optics)是一种新型的光电子集成技术,主要是通过采用硅通孔、重布线、倒装、凸点、引线键合等封装技术,将交换芯片和光引擎共同装配在同一个插槽上,形成芯片和模组的共封装。在 CPO技术中,光学组件被直接封装在交换机芯片旁边,进一步缩短了光信号输入和运算单元之间的电学互连长度,在提高光模块和 ASIC 芯片之间的互连密度的同时实现了更低的功耗,是解决未来大数据运算处理中海量数据高速传输问题的重要技术途径。此外 CPO技术在提高传输效率的同时,还有助于缩小设备体积,使得数据中心的布局更加紧凑,并可支持更高的带宽。
受材料性能影响,目前CPO 最主要是采用硅转接板。按照物理结构, CPO 可分为2D 平面CPO、2.5D CPO 和3D CPO,其中 3D 封装的CPO 技术是目前CPO技术研究热点,它将光电芯片进行垂直互连,能轻松实现更短的互连距离、更高的互连密度以及更低的功耗、更高的集成度和更紧凑的封装。CPO 预计将于2024-2025 年实现商用,2026-2027 年实现规模上量。
英特尔、博通、美满科技等行业内有突出贡献的公司均已推出多款基于 CPO 技术的量产产品,其中博通已发布交换容量为 51.2T 的 CPO 版本 Tomahawk 5 交换芯片,通过 8 个通道的光引擎对外互联,单通道速率为 6.4 Tb/s。此外云服务厂商 Facebook 和 Microsoft 亦创建了 CPO 联盟,以推动CPO 标准的建立和产品的发展。根据 Lightcounting 数据,CPO 出货预计将从 800G 和1.6T 端口开始,并于 2024 至 2025 年开始商用,2026 至 2027 年开始规模上量,产品主要使用在于超大型云服务商的数通短距场景。
Optical I/O(简称 OIO)是未解决计算芯片 CPU,GPU,XPU 等之间的互联问题(chip to chip interconnect),利用光互连低功耗、高带宽、低延迟的优势,取代传统的 electrical IO 方案。AI 推动计算架构大幅拓展,推动 I/O 带宽指数级增长、连接范围慢慢的变长。电气 I/O(即铜线连接)支持高带宽密度和低功耗,但传输距离较短(约为 1 米或更短)。当前数据中心和早期 AI 集群中使用的可插拔光模块能增加传输距离,但其成本和功率水平较高。一体封装的 xPU(CPU、GPU、IPU)光学 I/O 解决方案中,芯片输入输出的 IO 变为光信号,进而构建分布式计算网络,能支持更高的带宽、更高的功率效率、更低的延迟和更长的覆盖范围。我们大家都认为随技术和产业走向成熟,OIO 或成为 AI 和数据中心设计的重要互联方式。硅光技术可能是 OIO 的唯一光学解决方案。从封装形式上看,Optical IO 也是将光芯片与电芯片封装在同一基板上,因此 CPO 技术是采用硅光子实现光学 I/O 的第一步。同时,硅光技术可能是 Optical IO 的唯一光学解决方案,采用体积小、功耗低的微环调制器,利用多个波长携带信号,提高带宽密度。
硅光子学 (SiPh)是一种可以制造光子集成电路(PIC)的材料平台,它使用硅作为主要制造材料,而目前光模块中使用的光芯片以 III-V 族材料(磷化铟、砷化镓等)为主流。基于硅的成熟的 CMOS 工艺方便了将调制器、探测器及绝大部分无源光器件集成到一张硅基芯片上,光模块内部的分立器件可以被单片 PIC 取代,从而在不改变收发器外观尺寸的情况下获得功率、面积和成本优势,这使得基于硅光子的可插拔光模块能够无缝集成到现有系统中。即使激光器和光放大器不能与其他组件集成在一起,将剩余部分集成在单个芯片中也具备了成本和功耗优势。如下图表,同为400G DR4 可插拔光模块,硅光方案的器件数量少,结构相对比较简单,功耗低。
硅光凭借高集成度的优势,在 400G 时代被寄予厚望。但是根据太平洋科技新闻,中国信通院工程师谢俊杰在中国光网络大会上表示,硅光芯片需要在硅基集成 III-V 族化合物材料,两种材料的兼容性相对较差,决定了硅光晶圆良率低,慢慢的变成了制约硅光模块良率提升的主要瓶颈,整体看来400G 时代硅光和传统方案或在更大范围的应用场景并存,但难言颠覆。进入 800G 甚至 1.6T 时代,随着光模块内部通道数增加,传统方案将越来越难以平衡光模块的功耗、成本、尺寸,且由于需要对准、耦合的器件数量随着通道数同比提升,光模块良率将明显下滑,此时硅光方案的优势将愈发凸显。根据博通,在数据中心拓展时,传统分立方案光模块面临工程和生产限制,而模块的集成化是改善数据中心拓展能力的第一步,相比传统方案,硅光模块能够大大减少 30%的零件。此外,台积电入局有望加速硅光流片工艺成熟,有望解决目前工艺不成熟导致的硅光芯片良率问题,800G 时代或迎来硅光渗透率拐点。
根据Yole 的数据,2022 年硅光芯片(硅 PIC)市场空间6,800 万美元,预期 2028 年市场空间 6.1 亿美元,2022-2028 年复合增长率达 44%,且主要会由 800G 高速可插拔光模块推动。数通可插拔为硅光芯片主要使用在场景,且该应用场景预期在未来几年内保持快速地增长,为市场容量拓宽主要贡献因素。此外,数通无线侧及数通波分复用场景也预期保持较高增速。
相较于传统光模块产业链的价值分散、厂商众多,硅光产业链价值向上游集中,主要为跟随头部厂商方案的形式。根据 Yole,硅光产业链包含:垂直整合厂商(英特尔、思科、美满、博通、英伟达、IBM 等),SOI 衬底厂商,外延片厂商,流片平台(GlobalFoundries、Tower Jazz、台积电、IMEC、三星等),光模块封装厂商(中际旭创、Finisar、新易盛、光迅、博创等),设备厂商(思科、Arista、Juniper、华为、中兴等)及最终的数通电信客户(云厂商及电信运营商),参与者众多且逐渐多元化。由于硅光设计简化了光学部分结构,所需器件数量相比传统分立式方案一下子就下降,无源器件及封装环节价值量预计占比下降,产业价值向上游硅光芯片集中。光模块:总需求保持向上,硅光是趋势
光模块的核心功能在于完成光电信号转换及传输,传输带宽和拓扑结构决定了光模块用量。结合上文分析来看,AI 集群的规模一直在升级,已步入 10 万卡阶段,且有望逐步扩大,对于算力的总需求仍保持持续向上趋势,因而对于光模块的总需求仍保持向上趋势。
当前光模块主流方式选用分立方式,这种模式下对于生产和制造均有一定的要求和限制,导致光模块更大规模两场会受制于更多环节。技术演技上,硅光是集成化趋势下的长期选择,并有望从可插拔硅光形式逐步过渡到 CPO 形式。从分立模式到可插拔硅光形式,对器件使用量有望减少 30%,集成度提升带动量产规模能力提升,再到 CPO 形态,光模块的形态会更加紧凑。
硅光技术发展分为分立式硅基器件、耦合集成、单片集成演进、光电一体化等多个阶段,目前正处于耦合集成阶段。1.6T时代迭代 AI 突出的低功耗诉求,有望成为继 EML 后的重要补充方案。未来随着硅光子技术向单片集成技术发展,成熟 CMOS 工艺下成本有望进一步凸显,硅光为未来重要方向。
根据 Yole Group 最新数据,硅光子 PIC 市场预计从 2022 年 0.68 亿美元增长至 2028 年的 6.13 亿美元, 2022-2028 年复合年增长率为 44%。增长主要:1)800G 高数据速率可插拔硅光模块需求释放;2)对迅速增加的训练数据集大小的预测表明,数据将需要利用机器学习服务器中的光学 I/O 来扩展大模型。在落地形式上,预计可插拔硅光光模块先成熟,后演进至 CPO 形式。03
代表企业解析:旭创科技:全球高速光模块龙头,充分受益 AI 驱动的算力设施大建设
(一)公司率先发布800G/1.6T 等高速数通产品,卡位AI 算力设施建设浪潮
依据公司官网发布信息,公司在 2020年的ECOC 2020 线+和QSFP-DD800 DR8+光模块,其中QSFP-DD800 DR8+于2021 年1 月面向市场,其他 800G 产品在2021 年上半年进行送样评估,并于2021 年第四季度、2022 年第一季度陆续进行批量生产。公司是业内首个推出 800G 可插拔光模块的公司,领先行业其他竞品公司将近一年,其他竞品公司基本在2021 年才推出800G 系列光模块。公司800G QSFP-DD800 2xFR4 高速光模块曾荣获“2021 年度光通信最具竞争力产品”奖项。根据公司公开投资者问答,目前 800G 已实现量产,并在2023 年成为公司主力产品,预计 2024 年将持续上量。
公司1.6T 产品延续800G 产品一马当先的优势,有望抢占行业先机。公司于2023 年的OFC 2023展会上现场演示了 1.6T OSFP-XD DR8+可插拔光通信模块。依据公司公开投资者问答, 1.6T 目前正处于市场导入阶段,预计 2024 年下半年到 2025 年将逐步上量,此外公司已有1.6T 的硅光解决方案和自研硅光芯片。后续随着AI 算力设施的进一步迭代升级,1.6T光模块需求或逐步释放,公司凭借领先的产品实力和供应能力,有望率先把握下游客户的真实需求释放节点,充分享受代际更迭带来的新周期红利。
硅光解决方案集成度高,同时在峰值速度、能耗、成本等方面均拥有非常良好表现,是光模块未来的重要发展趋势之一。公司从 2017 年便开始组建自己的硅光芯片开发团队,在 OFC2019 上公司首次展示了基于硅光子的 400G QSFP-DD DR4 DEMO 产品。2022 年,公司在OFC2022 现场展示基于自主设计硅光芯片 800G 可插拔OSFP 2*FR4 和QSFP-DD DR8+硅光光模块。此后,公司在OFC2023 展示了其基于5nm DSP 和先进硅光子技术的第二代 800G 模块,相比传统方案有显著功耗优势。2024 年 2 月答投资者问上,公司表示已推出了搭载自研硅光芯片的400G 和800G 硅光模块。在硅光时代,公司产品能力将覆盖包括硅光芯片设计到模组封装全链条,掌握更多的产品增值环节。
与Tower Semiconductor 硅光平台合作流片,为企业来提供先进工艺及稳定流片。
2023 年9 月,公司和模拟半导体代工解决方案的领导者Tower Semiconductor 宣布合作开发基于Tower 硅光子学工艺平台(PH18)的多代高速光模块。Tower Semiconductor 是领先的高价值模拟半导体解决方案代工厂商,为一直增长的市场提供集成电路(ICs)的技术和制造平台,这些市场包括消费品、工业、汽车、移动通信、基础设施、医疗和航空航天等领域。此外 Tower Semiconductor 拥有的业界领先的高产量 PH18M SiPho 平台,可提供一系列丰富的光学元件,包括超高带宽调制器、光电探测器、低损耗波导和光耦合解决方案。
结合成熟的设计库,该平台可提供设计仿真到芯片性能的准确匹配,使设计人员能够以最小的设计迭代将解决方案按时推向市场。此次公司与 Tower Semiconductor 的战略合作伙伴关系有望助力公司在人工智能、数据中心和下一代电信网络一直增长的需求提供先进的解决方案。
LPO 自 2023 年OFC 展会后便凭借其出色的功耗和成本控制备受行业关注,依据公司官网显示,公司也于OFC 2024 上展示了 LPO 产品—1.6T-LPO-DR8 OSFP 模块,采用自研的硅光芯片和线性 Driver/TIA,可实现低功耗和低延迟。依据公司公开投资者问答,公司目前已具备LPO有关技术储备,并会按照每个客户需求做好量产准备。(来源:华创证券研究所)