Astera Labs:数据中心互联的领头羊之一
Part 2 of 2
Astera Labs公司目前主要有四个产品线:
(1),Retimer芯片:Aries是公司PCIe Retimer芯片业务,Retimer以数字方式恢复降级的高速信号并重新传输数据,从而保证很高的数据带宽;
(2),AEC:Taurus是公司有源电缆(AEC)模块业务,主要通过以太网扩展服务器和交换机之间的传输;
(3),CXL内存控制器:Leo系列产品是公司基于CXL技术拓展的内存连接控制器业务,主要在于解决 “内存墙”问题;
(4),全新的,专为云数据中心AI基础设施打造的Scorpio Smart Fabric交换机产品组合。
下文,我们将分别按照公司的四块业务展开具体分析。
一、Retimer:需求和AI服务器的出货密切相关
(1)为什么 Retimer 有望成为主流的信号衰减解决方案?
随着技术不断进步,PCIe的传输速度也在一代代升级。PCIe是电脑硬件间数据传输的重要协议,从最初的PCI、PCI-X发展到如今主流的PCIe,它一直在更新换代。目前从 PCIe 3.0到4.0再到5.0,每升级一代传输速率实现了翻倍,比如从8GT/s提升到16GT/s,再到32GT/s。而最新的PCIe 6.0更是达到了64GT/s的惊人速度。
高速度虽然很诱人,但问题也随之而来,比如信号传输中会出现“插损”现象,也就是信号越来越弱。为了解决这个问题,现在主要有三种方案:
* 换低损耗的PCB板。虽然效果不错,但成本太高,而且用在复杂多连接器的设备上不划算。
* 用信号放大器Redriver。这是一种更便宜的方案,通过放大信号的高频部分补偿损耗,技术上算简单实用,但性能不够标准化。
* 用信号恢复器Retimer。它会重新同步信号,把传输中的抖动和时间误差都修复,简单来说就是把原信号拷贝成一个“干净版”。
和其他两种方案比起来,Retimer性价比最高,性能更强,还能兼容未来的CXL技术,应用场景更广,所以目前被视为最优解。
(2)Retimer的市场机会在哪里?
Retimer的最大市场动力来自AI服务器的需求和PCIe 5.0甚至6.0的普及。
a),AI服务器带来的新需求
AI应用爆发催生了大量训练和推理需求,而GPU服务器是这个过程的关键硬件。一台标准的8卡NVidia H100 GPU服务器大概需要8+4=12颗Retimer芯片,用来解决PCI 5.0的信号问题。
当然,到了GB200这一代,因为自带CPU,在NV设计的NVL72 GB200的服务器内甚至不再需要Retimer。
b),通用服务器中的扩展需求
除了AI服务器,普通数据中心的服务器也开始用Retimer。尤其是随着PCIe 5.0的渗透,主板上用到Retimer的场景越来越多,比如插槽间距较远时,需要Retimer来保证信号完整性。一台通用服务器用1-2颗Retimer就够,但随着使用规模增加,这块市场的增速也非常明显。
简单来说,AI服务器的爆发和PCIe 5.0的普及共同推动了Retimer芯片的成长空间,这块市场值得期待!
(三) 市场格局:Astera Labs目前占据优势,澜起科技在中国有机会,博通和Marvell是新进玩家。
Astera Labs是当前Retimer市场的领军者
在 Retimer市场上,Astera Labs,TI是目前的主力玩家,其中 Astera Labs处于绝对领先地位。Astera Labs是全球首家推出并量产PCIe 5.0 Retimer芯片的厂商,在 PCIe 4.0和 5.0市场上占了大半的份额。英伟达,AMD,英特尔等芯片巨头以及微软,谷歌,亚马逊等科技巨头均是Astera Labs的主要客户。还记得昨天我提到过的故事,亚马逊这样的巨头甚至用股权加采购承诺的方式捆绑了Astera Labs。
当然,新兴的ASIC巨头博通和Marvell躬身入局。
博通于今年年3月发布了基于5nm工艺的PCIe 5.0和PCIe 6.0 Retimer芯片解决方案 —— Vantage 5和Vantage 6。两款产品不仅支持最新的 PCIe标准,还兼容CXL 2.0和 CXL 3.1技术。经询问产业链,博通应该算是最强劲的新进玩家。
Marvell也是在5月份同样推出了全新PCIe重定时器产品线 —— Alaska P PCIe重定时器。产品可扩展 AI加速器,GPU,CPU和服务器内其他组件之间的连接。5nm 16通道PCIe 6重定时器的典型功耗为10瓦,是目前业界功耗最低的重定时器。
还有,澜起科技是中国唯一能量产PCIe 4.0和PCIe 5.0 Retimer芯片的厂商。公司早在2018年就开始布局Retimer技术,并于2020年完成了PCIe 4.0 Retimer的研发,这款产品在功耗和延时等关键性能指标上达到了国际先进水平。2021年开始,这款芯片随着支持 PCIe 4.0的主流服务器 CPU上市,逐步进入市场,并为澜起带来了1220 万元的营收,成功实现从“0到1”的突破。当然,澜起并没有止步于PCIe 4.0,2023年1月,公司推出了支持PCIe 5.0和CXL 2.0的 Retimer芯片并实现量产,目前已经规模出货(量还不小),在国产厂商的GPU系统上上线。依靠自研IP,澜起的产品在时延,信道适应能力等关键指标上表现亮眼,展现了不错的技术竞争力。
总结
Astera Labs在Retimer领域仍占据主导地位,但博通和Marvell躬身入局对Astera Labs应该会影响比较大;澜起科技作为中国本土玩家,在国内有较大的机会。总之,接下来整个Retimer市场更加竞争激烈和充满机会。
二、AEC:800G 速率或加速 AEC 需求
(一) 什么是 AEC?
AEC(Active Electrical Cable)就是一种有源电缆,它在传统铜缆里加了点“黑科技”,嵌入了像 Retimer(信号重定时器)或者 Redriver(信号放大器)这样的信号增强芯片。这种设计能有效增强信号质量、延长传输距离。比如 Astera Labs 的 AEC 产品,会在电缆两端加入 Retimer,优化云计算和 AI 数据中心的网络连接,帮忙解决机柜级以太网传输的瓶颈问题。他们的 Taurus 系列产品甚至还集成了自家的 COSMOS 软件套件,进一步提升性能。
为什么 800G 网络会让 AEC 大火?
传统的 DAC(Direct Attach Cable,直连铜缆)因为成本低、功耗几乎为零,一直是数据中心短距离连接的首选。但是,随着传输速率越来越高,DAC 的缺点暴露了 —— 传输距离缩短,信号噪音变大,干扰更明显,同时线缆变得又粗又笨重。尤其是面对 AI 集群快速发展的布局和布线需求,DAC 显得有些力不从心了。
于是,市场开始尝试两种改进:
* 换成 AOC(光缆);
* 或者升级成 AEC 或 ACC(有源铜缆)。
相比之下,AEC 有不少优势:
* 比 AOC(光缆):功耗低、成本便宜。虽然光缆传输距离更长(几公里都可以),但它的成本高、耗电多,还容易坏。
* 比 DAC(直连铜缆):传输距离长了一倍多(可达 7 米左右),而且更轻便,安装和布线都简单。
随着服务器接口逐步迈向 56Gbps PAM-4 信号、400G/800G 网络成为标配,DAC的传输距离压缩到 3米以内,而 AEC这种增强版铜缆则因为性能好、价格实惠,成了理想选择。
(二) AEC 的市场有多大?
AEC的需求目前增长非常快,有望成为 10 亿美金级别的大市场。它主要用于机架内或相邻机架之间,比如连接交换机和服务器,或者扩展 GPU集群,以解决布线复杂、气流受阻等问题。Astera Labs的招股书里提到,根据 650 Group 的预测,数据中心的以太网连接市场规模预计会从2023年的40亿美元增至2027年的58亿美元。而800G网络快速普及后,AEC预计会占到互连市场的63%。
换句话说,AEC市场规模将从2023年的7000万美元快速增长到2027年的13亿美元,年均复合增长率(CAGR)达到 108%。
总的来说,随着AI和云计算快速发展,AEC在高效、稳定的网络连接中扮演越来越重要的角色,市场潜力非常大!
三,用 CXL 技术化解内存瓶颈
面对这个“内存墙”,业界已经尝试过很多解决方案,比如 IBM、AMD 和 Intel 等大公司都曾推出自己的协议(CAPI、GenZ、CCIX 等)。不过这些方案由于生态体系或标准不够统一,最终都没能成功推广。现在,能站稳脚跟的高速互联协议只剩两个:CXL(Compute Express Link) 和 NVLink。它们的核心目标是通过重新定义内存层次结构,实现更高的带宽、更低的延迟,以及内存共享和更高效的资源利用率,从而彻底解决内存瓶颈问题。
CXL的版本演进
CXL技术的发展大致分为三个阶段:
* CXL 1.0/1.1(2019年发布):最初版,奠定了基础。
* CXL 2.0(2020年发布):加入了内存池化、按需分配以及更高的安全性(IDE 功能)。
* CXL 3.0(2022年发布):实现了更彻底的内存共享,增加了设备之间互连的网络能力(Fabric 支持),而且全面向下兼容所有前代版本。
CXL技术正在通过这些迭代,朝着更灵活的连接架构和更智能的内存共享机制迈进。
CXL设备的分类
CXL联盟定义了支持的三种设备类型:
* 类型 1:比如智能 NIC,用于加速网络通信。
* 类型 2:包括 CPU、GPU、FPGA 等带有内存的加速器。
* 类型 3:用于扩展内存带宽和容量的设备,比如内存缓冲器,支持内存池化。
其中,每种设备都需要支持 https://t.co/gVJUHCsxuN 协议,因为它负责链接初始化。一旦 https://t.co/gVJUHCsxuN 出现问题,设备链接就无法正常工作。
CXL市场上的主要玩家
目前,Astera Labs,Marvell和中国的澜起科技都在推动 CXL 内存控制器的落地:
Astera Labs:推出了 Leo系列 CXL内存控制器。它支持 CXL 1.1 和 CXL 2.0,带宽可达 x16 PCIe 5.0 通道,通过多个 DDR5 通道,将内存容量扩展到 2TB,同时大幅优化内存利用率。
Marvell今年也推出Structera X CXL 内存扩展控制器,基于5nm工艺设计。Structera X 2504这颗芯片支持最大6TB的 DDR5 DRAM内存容量扩展,相当程度上帮助实现 GPU和定制 AI ASIC之间的高效内存共享,为加速计算提供了统一的内存互联。
澜起科技:2022 年发布全球首款 CXL 内存扩展控制器芯片(MXC),引起行业关注。
此外,存储厂商也在积极跟进,比如三星推出了支持 CXL 1.1 和 2.0 的大容量 DRAM 模块,可将内存扩展到 TB 级别,还显著降低系统延迟。
四、Astera Labs推出Scorpio Smart Fabric交换机系列 —— 瞄准AI数据中心的全新利器
今年四季度初,Astera Labs发布了一款针对云数据中心AI基础设施的新产品:Scorpio Smart Fabric交换机系列。如果你对AI数据中心的架构感兴趣,这个消息一定值得一看。
当然,最近还有个重要背景消息不得不提:一个叫 UALink(Ultra Accelerator Link)的新联盟宣布,他们将于2025年一季度推出UALink 1.0标准。这是为大规模AI加速器互连打造的行业开放标准,直接对标的是Nvidia的专有技术NVLink。你可能知道,NVLink不仅促进了Nvidia GPU之间的高速通信,还结合Infiniband技术提供了卓越的可扩展性。而UALink联盟的目标就是要打破这个专有垄断,把行业的连接标准变得更开放。
这个联盟里可是大牌云集,包括 AMD,英特尔,AWS,微软,谷歌,Meta,HPE,Cisco 等科技巨头,而 Astera Labs是其中核心的ASIC成员。这一背景也让 Astera Labs的新品显得更加吸引人。
Scorpio系列产品线:专注PCIe 6.0连接和GPU集群优化
这次发布的 Scorpio Smart Fabric包括两条产品线,分别聚焦不同的应用场景:
* P系列交换机:支持GPU和CPU/NIC/SSD之间的PCIe 6.0连接,专门为混合流量头节点通信设计,能高效整合各种主机和端点设备的生态系统。
* X系列交换机:定位于GPU集群的专用后台平台,用于大规模扩展和优化GPU间的连接。
说得简单点,这个Scorpio系列更像是Nvidia的NVSwitch芯片的替代品,而且覆盖了从单服务器内的Scale Up到跨多服务器的Scale Out的场景。
官方还给出了一个概念图,相信比文字更容易让你看明白这些交换机是如何工作的。
Astera Labs:从交换机产品延展至广阔市场机会
Astera Labs在第三季度的财报中也对Scorpio系列表达了信心。他们指出,这个系列不仅补充了现有PCIe和以太网Retimer产品,还扩展到了CXL内存控制器之外的新市场。公司预计,到 2028年,Scorpio系列将把公司总市场规模扩大到120亿美元!
按照分析师预测,Scorpio P系列和X系列最有可能进入定制化GB200/GB300计算节点的云服务提供商序列(目前已进入AWS和Google)。仅以这些大云服务提供商的部署为例,明年会有超过200万片GB200/GB300出货,那么对应后端NV Switch交换机的需求量将达到50万颗。而前端节点使用的P系列芯片量,理论上还会更大一些。
总结:Astera Labs抢占AI基础设施的下一个关键点
Scorpio Smart Fabric交换机不仅技术上抢先支持PCIe 6.0,而且还对标了Nvidia的NVSwitch,瞄准了AI加速器互连和云数据中心的核心需求。结合UALink联盟的背景,Astera Labs有望通过这一系列新品,在激烈的市场竞争中站稳脚跟,同时进一步扩大市场布局。
可以说,AI和云计算的未来,Astera Labs已经深深押注其中,Scorpio系列能达到什么高度,值得我们持续关注。
点击图片查看原图
点击图片查看原图