去搜搜
头像

降低AI高算力能耗的CPO,是炒作还是投资机会?

发布于 2023-03-29 11:46

ChatGPT现象级应用的火热出圈加速了AI产业的进程,AI的高速发展增加了对更高的算力需求,也大幅提升了能耗和成本。

 

以作为算力载体的数据中心为例,根据中国电子技术标准化研究院数据,2021年全国数据中心总用电量为2166亿千瓦时,占全国总用电量的2.6%,相当于2个三峡水电站的年发电量,1.8个北京地区的总用电量。

 

在数据中心中,网络设备中的交换芯片、光模块、SerDes是三座“功耗”大山。此外,IT设备散热也是能耗的大头。为满足低功耗、低成本、高能效的诉求,CPO技术提供了新的解决方案,它能够降低网络设备如交换机、路由器等的自身工作功耗以及散热功耗。

 

随着近期ChatGPT在资本市场上的火爆,CPO也备受二级市场投资者的关注。那么,CPO的原理是什么呢?它的优势和技术挑战如何?是概念炒作,还是投资机会?投资者该如何关注呢?


核心看点:

  1. 目前CPO有两大技术及应用:一是基于VCSEL技术,针对超算及AI机群的短距离光互联;二是基于硅光技术,大型数据中心的机架及机群之间光互联的应用。

  2. CPO的技术壁垒很高,核心技术挑战是高密度的光电(驱动)芯片设计技术、高密度及高带宽的连接器技术、封装和散热技术。

  3. CPO是终极形态,NPO是过渡阶段。当前一些厂商可以提供NPO交换机。CPO可能在2024-2025年开始商用,在2026-2027年开始规模上量。


Q:CPO技术是什么?它有哪些优势?市场前景如何?


A:CPO(Co-packaged optics,共封装光学)是将网络交换芯片和光引擎(光模块)进行“封装”的技术。具体来说,CPO将网络交换芯片和光引擎共同装配在同一个Socketed(插槽)上,形成芯片和模组的共封装。

 

传统的连接方式是Pluggable(可插拔)。光引擎是可插拔的光模块。光纤过来以后,插在光模块上,然后通过SerDes通道,送到网络交换芯片(AISC)。

 

之所以要做集成(“封装”),是为了缩短了交换芯片和光引擎间的距离(控制在5~7cm),使得高速电信号能够高质量地在两者之间传输,满足系统的误码率(BER)要求。集成后还可以实现更高密度的高速端口,提升整机的带宽密度。此外,集成使得元件更加集中,也有利于引入冷板液冷。

 

CPO的兄弟,NPO(Nearpackaged optics,近封装光学),是将光引擎与交换芯片分开,装配在同一块PCB基板上。所以可见,CPO是终极形态,NPO是过渡阶段。NPO更容易实现,也更具开放性。





CPO形式基于硅光技术。硅光,是以光子和电子为信息载体的硅基光电子大规模集成技术。简单来说,就是把多种光器件集成在一个硅基衬底上,变成集成“光”路。它是一种微型光学系统。硅光之所以这么火,根本原因在于微电子技术已经逐渐接近性能极限,传统的“电芯片”在带宽、功耗、时延方面越来越力不从心,就改走了“(硅)光芯片”这个新赛道。

 

硅光集成工艺,具备低成本、低功耗、高集成度的潜质。在数通短距的场景,硅光模块取得局部商业成功,CPO方案因为能突破速率极限和结构简化,有望成为硅光最大应用场景。

 

CPO的优势。主要是降低能耗,也就是省电。其次,体积小,有助于引入液冷。因为能耗低和体积小,所以成本就更低。未来规模化上量后具备经济性。


图:CPO降功耗原理


CPO的市场前景。根据通信市场研究公司LightCounting,预计CPO将从800G、1.6T端口开始出货,于2024年开始商用,最早2026年规模上量,应用于超大型云服务商的数通短距场景。预计CPO的发货量将从2023年的5万件增加到2027年的450万件;预计到2027年,CPO端口将占800G和1.6T端口总数的近30%,CPO市场收入将达到54亿美元。

 

Q:作为先进的高性能封装形式,CPO有哪些技术壁垒和挑战?

 

A:CPO的技术壁垒很高,有三个核心技术挑战:高密度的光电(驱动)芯片设计技术、高密度及高带宽的连接器技术、封装和散热技术。CPO将增加带宽和缩小收发器尺寸,光学和硅片的高度集成,意味着制造商将需要新的工程能力和工厂。

 

目前只有博通、英特尔、Ranovus、英伟达、AyarLabs等少数公司具备向市场提供专有解决方案的内部能力。

 

Q:目前CPO的技术进展和商业进程如何?预计何时上量?


A:技术进展。前面提到,CPO的发展主要依赖于硅光技术的发展,分为两个阶段:第一阶段是NPO,也就是我们前面说的过渡阶段,在最短时间内享受到低成本、低功耗收益;第二阶段是CPO,这是交换机硅光技术的最终形态,可以极限降低网络的成本和功耗。

 

据COBO(板载光纤模块联盟),NPO是CPO技术方案的第一代,是当前现实情况下一些厂商都可以提供的。

 

CPO模式是一种多芯片模块,16个光引擎环绕交换芯片,25.6Tbps需要16个1.6Tbps模块,51.2Tbps需要16个3.2Tbps模块,在当前的技术条件下难以实现。

 

NPO方案依靠中间层Interposer(主板之上的一种高性能PCB底板),方便交换芯片到光引擎的信号路由,PCB无需升级、成本大幅降低,且无须担心同一底板上的光引擎出现故障。

 

据Lightcounting预测,CPO方案可能在2024-2025年开始商用,在2026-2027年开始规模上量。目前CPO有两大技术及应用:1)基于VCSEL技术,多模光纤,应用场景30米以内,针对超算及AI机群的短距离光互联(IBM为代表);2)基于硅光技术,单模光纤,应用场景2公里以下,大型数据中心的机架及机群之间光互联的应用(微软和Facebook为代表)。

 

目前看,CPO商用尚需时日。除了因为CPO具有很高的技术挑战,考验厂商的研发能力和制程工艺,也受限于产业链的成熟度和市场接受度。产业成熟需要时间,如果只有个别厂家做,出货量不足,产品价格高。随着应用CPO的产品被越来越多厂商研发生产出来,价格降低,运营商和数据中心就会批量采购。不可能指望运营商或数据中心在一天内把所有机房的交换机都换掉,而是随着时间把旧交换机淘汰,换新交换机时就会买配有NPO、CPO技术的交换机,然后重复……


Q:目前国内CPO领域的竞争者有哪些?投资者应该如何关注?

 

A:国内布局CPO技术研发或业务的厂商有很多,像联特科技、锐捷网络、中际旭创、通宇通讯、中京电子、天孚通信、新易盛、光迅科技等。

 

但目前还都没有产品商用,CPO概念的火爆,短期看市场炒作的成分比较大,但长期可以关注布局NPO、CPO产品和具有所需技术的厂商。

 

其中,联特科技有NPO、CPO所需的高速光连接技术、激光器技术和芯片级光电混合封装技术。

 

新易盛有基于硅光解决方案的400G光模块产品及基于EML和SiPh解决方案的800G光模块产品。

 

锐捷网络有一款51.2T NPO冷板式液冷交换机(最快在2023年底商用发布),是与OIF国际组织合作研发的。将NPO模组从1.6T升级到了3.2T,前面板支持64个800G连接器,每个连接器还可以分成2个400G端口,向前兼容。在实际组网中,这款交换机可用于100G/200G的接入网络,作为接入&汇聚设备。而且,锐捷网络也是OIF/COBO的成员,参与了相关标准制定。

 

图:51.2T NPO冷板式液冷交换机



相关阅读

本回答由1位专家参与