展会期间,来自海思光电子有限公司的总监梁总接受《光引未来·大咖说》的访谈,全面解读了海思在 AI 光互联领域的技术布局与行业洞察。
扫码查看完整采访
海思光电:深耕光电领域二十载,构建端到端产业能力
海思光电是全球领先的光电解决方案供应商,深耕光通信技术20余年,致力于为固定接入、无线接入、城域电信、骨干传送、无线网络、及数据中心提供全系列光电解决方案,并构建了从底层光电技术、芯片设计到器件封装、模块制造的端到端产业能力。我们的产品覆盖100G到1.6T的全系列光模块,广泛应用于云计算、超宽带网络及AI计算中心等场景。海思光电在AI计算领域持续投入,推出了StarMatrix星云光互联解决方案,专注于为AI智算中心提供高可靠、高性能、高可用的光互联解决方案。
中国 AI 竞争力:系统算力反超美国,应用端实现突破
在全球 AI 竞争格局中,中国与美国形成双足鼎立态势。AI全领域竞争要素包括算力、模型、应用三方面。
算力方面,据美国科技媒体Semi Analysis日前发布的报告对比中美顶流计算平台显示,尽管中国在单芯片算力上仍落后于美国,但凭借光互联领域的优势,系统算力已达到美国的 1.7 倍。
模型方面,美国斯坦福大学人工智能研究中心报告指出,中美大模型的差距已缩小至3.7%。今年年初,中国的DeepSeek大模型发布,颠覆了全球AI产业,它降低了大模型训练对算力的需求,同时通过开源降低了大模型训练的门槛,也加速了AI推理应用的发展。
应用层面,中国在 AI Agent 领域实现反超。应用强依赖数据和细分行业,美国更擅长在B端发力,如Copilot嵌入Windows,中国则更擅长C端突破和垂直行业整合融合;美国采用SaaS订阅模式,中国则更习惯免费加流量模式。
全球知名咨询公司LightCounting的最新报告显示,全球Top10的光模块供应商中,中国企业占比快速提升,2023年已达到7家,但底层芯片,尤其是56G以上的高端芯片仍主要依赖进口。中国光模块厂商已意识到底层芯片自主可控的重要性,开始投资底层芯片,目前主要聚焦在56G以下的中低端芯片。
AI智算中心:光互联需求重构,可靠性成核心挑战
随着两年前ChatGPT的面世,业界被AI驱动进入高速发展阶段,传统数据中心的建设也在AI驱动下发生从“以网络为中心”到“以计算为中心”的转变。通用数据中心(General DC)以网络交换为中心,计算单元主要是CPU,其网络是传统网络的延伸;AI智算中心(AIDC)的计算单元是XPU的芯片,网络互联不再是网络的延伸,而是计算的延伸。
在核心目标上,通用数据中心的网络侧重互联互通来体现其灵活性和多租户特性;AI智算中心的网络则更强调低延时、高吞吐和确定性连接。在流量特征上,通用数据中心的流量是突发、稀疏、混合的,带宽占用率通常低于30%,部分甚至长期低于10%;AI智算中心的流量是持续、满带宽的,带宽利用率常超过80%,且多处于长满跑状态。在可靠性要求上,通用数据中心基于传统以太网,具备恢复重传机制,可容忍短暂业务中断;AI智算中心对链路闪断则是零容忍,一旦发生链路闪断导致业务回滚,整个大模型训练会回到上一个检查点(Checkpoint),期间所有训练数据失效,直接造成经济损失。
据某客户在公开论坛分享,其万卡AI计算中心集群的一次业务回滚,经济损失就达300万元人民币。梁总认为,光互联在AI智算中心的功耗和成本占比其实不到10%,此前业界所谓“光互联成本功耗占比高”的说法,是对统计分母的考量不够完整。AI智算中心的功耗和成本核心集中在计算侧,而光互联的核心任务是为XPU集群提供高可靠、高性能、高可用的互联网络。其中,高可靠意味着提供稳定可靠的连接,保障长期传输稳定性;高性能意味着提供低时延、低功耗、长距离传输,支撑超大规模智算组网;高可用则要求及时发现光链路中可能存在的隐患(如端面脏污、光纤弯损、折叠和破裂),避免业务训练闪断及回滚,且出现问题后能准确定位、快速排障。
光模块适配:从成本导向到技术驱动的范式转变
通用数据中心对光模块多追求性价比,满足基础需求后会优先选择成本低、供应稳定的产品。但AI智算中心的光互联更核心的是提供稳定可靠的光连接,因此AIDC所需光模块与通用DC光模块本质不同,不再一味追求低成本,而是需从多维度适配,避免将芯片服务器置于不可靠网络中。第一,选用更稳定可靠的底层芯片,降低光模块本体失效率。光模块中激光器的失效率相对较高,海思光电在激光芯片领域有多年技术积累,采用垂直整合(IDM)模式,拥有自有化合物半导体工厂(FAB)和工艺,可强化光模块、光芯片本身的可靠性。第二,采用极简高效的模块架构。由于海思光电的芯片器件均为自研,可开展系统级协同联合设计优化,比如通过降低摆幅、去除驱动器、TEC等芯片和器件,减少时延与功耗。第三,强化智能化运维。光链路稳定性对AI智算中心至关重要,因此需通过光模块内置的智能感知功能,实现全链路,包括光模块本体、光电接口、光纤的健康诊断与故障预测,消除AI训练开局的隐患。
StarMatrix 星云方案:定义 AI 光互联新标杆
据梁总介绍,海思光电针对AI智算中心对光互联的高可靠、高性能、高稳定的需求,将20余年来在光电领域的端到端技术积累进行系统级重构,推出StarMatrix星云光互联解决方案,并创造性推出StarSensor星云智检功能,支持昇腾384超节点超长稳定运行。根据线网实测结果,全链路检测时间相比行业水平降低60倍,故障检出率提升200%,故障准确率也提升200%;StarSensor星云智检可实现分钟级检测、厘米级检测精度。
海思光电的技术布局与行业洞察,折射出中国在 AI 光互联领域的战略深度与创新活力。随着全球 AI 竞争进入 “算力 - 模型 - 应用” 全链条博弈阶段,光互联作为算力网络的 “神经中枢”,其技术突破将直接影响产业格局。正如梁总所言:“夯实基础技术创新基石,是我国在全球市场立足的关键。” 未来,海思光电将继续以技术引领行业变革,助力中国在 AI 算力竞赛中赢得先机。