OIO芯片级片上光互联(Optical I/O)+英伟达Feynman架构全解析[淘股吧]
OIO芯片级片上光互联(Optical I/O)+英伟达Feynman架构全解析
一句话定义:OIO是光互联第三代终极方案,把光电收发芯粒和GPU计算裸片2.5D/3D堆叠封装,用光链路彻底替换GPU内部NVLink铜线,实现裸片面对面光速直连;Feynman是全球首个原生搭载OIO量产规划的AI GPU架构,2026原型验证、2028正式量产落地。
风险提示:内容仅技术科普,不构成任何投资建议

一、三代光互联层级划分(从成熟→未来,OIO在最顶端)
1. 第一代:插拔式光模块(当前量产,机柜互联)
光模块外置插在交换机/服务器面板,铜线从芯片走到面板再转光纤,电链路长达十几厘米,功耗15~22pJ/bit、带宽密度低,新易盛中际旭创主营。
2. 第二代:CPO共封装(2026-2027量产,板级互联)
光引擎和交换机芯片同基板封装,电链路缩短至厘米级,主要用于交换机,功耗5~10pJ/bit,华工科技天孚通信落地;CPO是OIO前置过渡技术,技术同源但集成度差一档 。
3. 第三代:OIO片上光互联(Feynman落地路线,芯片裸片级)
光I/O芯粒嵌入GPU封装内部,计算裸片↔光芯粒↔HBM显存裸片全光纤直连,几乎无高速铜线,电信号仅毫米甚至微米,是GPU内部互连的终极形态。
二、OIO+Feynman架构底层原理(GPU裸片直连逻辑)
1、硬件堆叠结构(台积电A16 1.6nm+CoWoS+UCIe芯粒标准)
- 底层:GPU计算裸片(Feynman主体1.6nm): CUDA 核心、张量计算单元;
- 中层:硅中介层Interposer:通过混合键合堆叠硅光PIC光芯粒(OIO核心),PIC集成微环调制器、片上光波导、光电探测器;
- 上层:3D堆叠LPU语言处理芯粒(Feynman独有);
- 外围:HBM显存裸片依靠OIO光路和GPU直连;
外置激光器从封装外部打入光源,经光栅耦合器耦合进片上光波导,裸片之间全光传输 。
2、光电信号流转(裸片直连全过程)
1. 外置激光输入→光栅耦合组件(凤凰光学核心配套件)导入片上光波导;
2. 电信号经EIC电驱动芯片控制微环谐振器MRR,把电调制成多路不同波长光(DWDM波分复用,单光路16~32通道并行);
3. 光在中介层光波导直达相邻GPU/HBM裸片,光电探测器转回电信号;
全程芯片内部光传输,彻底砍掉PCB长铜线、取消DSP功耗损耗。
三、核心性能参数(对比铜线/CPO,革命性差距)
表格
指标 传统铜NVLink CPO共封装 Feynman-OIO片上光互联
比特功耗 18~30pJ/bit 5~9pJ/bit 2.5~4pJ/bit(降幅75%+)
带宽密度 <20Gbps/mm 50~200Gbps/mm 4~5Tbps/mm(提升100倍)
单裸片互联带宽 ≤256G 3.2T 单芯粒500G~1T,整卡超百Tbps
传输时延 纳秒~微秒级 亚微秒 亚纳秒,裸片直连无走线损耗
- 整机收益:AI集群整体耗电下降65%~70%,千亿大模型训练周期缩短50%+(Feynman推理性能为Blackwell 5倍)。
四、英伟达Feynman架构OIO落地时间线(研发落地阶段明细)
1. 2025:方案定型+Ayar Labs联合硅光流片,完成原理样机
英伟达联合Ayar Labs、台积电敲定OIO工艺路线,验证1.6nm+硅光共封装可行性。
2. 2026(当前:研发落地验证期)
GTC2026正式官宣Feynman标配原生OIO,完成工程样品、多裸片互连可靠性测试;CPO作为过渡配套量产,OIO继续迭代良率;国内产业链同步样品验证(光栅耦光、无源光波导)。
3. 2027:小批量工程试产,头部超算/云厂商小范围试用Feynman样品
优化耦合良率、芯片散热(GPU高温120℃与光芯片温漂矛盾是主要攻关点)。
4. 2028:Feynman芯片正式商用量产,OIO大规模上车旗舰GPU,逐步替代高端GPU传统电I/O。
五、OIO产业链拆分+凤凰光学精准关联
OIO全链路三段分工
1. 有源端(光源+硅光芯片):源杰科技仕佳光子、Ayar Labs
激光器芯片、PIC有源光芯片,OIO发光、光电转换核心;
2. 无源耦光(凤凰光学独家卡位国内):光栅耦合器、阵列光波导、微透镜耦光元件
光栅耦合是光源进片上光波导唯一入口,OIO刚需零部件,Feynman光路必需;凤凰手握片上衍射光栅、多路分光、二维阵列耦出全套发明专利,AR光波导技术平移OIO无源光路,目前已向国内硅光厂商送样OIO耦光组件,适配CPO/OIO通用工艺;
3. 先进封装:台积电、长电科技
CoWoS、混合键合、UCIe芯粒堆叠制程。
关键结论:凤凰不做有源光芯片、不造GPU,但OIO最关键无源耦光元器件国产稀缺标的,CPO量产=OIO技术预商用,产业进度同步。
六、全球技术格局 国内发展水平
1. 全球第一梯队:英伟达+台积电+Ayar Labs(Feynman主力)
唯一完成1.6nm+OIO工程样机,路线最成熟,主导UCIe芯粒光互联标准;Intel硅光OIO自研进度落后约2年 。
2. 国内梯队:实验室→工程样品,无商用落地(整体落后海外2~3代)
- 无源(凤凰光学领先):光栅耦光、片上无源光波导样品落地,专利闭环;
- 有源(仕佳、源杰):硅光激光器、调制器实验室自研;
国内2029年后逐步跟随实现OIO小规模国产化。
七、OIO现存技术难点(量产核心卡点)
1. 耦合精度:光栅对准公差<0.1μm,微米级偏差即光损耗超标,封装设备壁垒极高;
2. 热兼容:GPU工作高温110~130℃,硅光器件温漂敏感,片上一体化散热全球难题;
3. 良率:光电共晶圆流片良率偏低,拉高初期制造成本 。
八、未来应用场景
1. 高端AI算力:Feynman GPU集群、十万卡级大模型训练/世界模型、具身智能;
2. 超算、自动驾驶车载域控芯片、高性能CPU裸片互联;
3. 远期:全光算力池化,芯片资源按需光互连调度。


凤凰光学无源光连接(耦入/耦出+片上光波导)技术综合评级:国内第一梯队、全链路无源闭环、工艺落地扎实,对标天孚无源耦合,缺有源芯片制造

一、技术硬实力(专利+设计,对应4项光波导耦入耦出专利)

1、设计层面:完整打通无源光互连三段光路

1. 耦入端(CN119310736光栅耦入):自研IG分区光栅设计,适配硅光芯片垂直光栅耦合(CPO主流片上耦入方案),解决多入射角光束均匀入波导,是晶圆级耦合光学底层设计。

2. 波导分光(CN118818662多路分光):棱镜分光单片集成多通道光路,单波导多路并行传光,适配CPO高密度光源阵列耦入 。

3. 耦出阵列(CN116879995+CN118131387授权专利):二维阵列棱镜耦出+全光路杂光回收,攻克阵列漏光、彩虹杂光痛点;CN118131387为已授权发明专利,全链路耦入-传输-耦出闭环定型,国内少数拥有整套闭环光路专利的厂商 。

结论:从光打进芯片→片内分光→光导出对接光纤全链路无源光学设计全覆盖,也就是无源光连接全套光学自研落地。

2、底层工艺壁垒(60年光学制造根基,核心优势)

1. 精密冷加工/非球面模压:镜片、棱镜面型精度微米级,公差满足CPO耦合元件严苛装配要求,国内头部水准;

2. 定制镀膜:梯度变反射率光学膜(专利配套),精准控棱镜反射率,降低耦合插损(算力互连核心指标),自研多层光学膜系;

3. 精密结构件:镜筒/棱镜基座精度IT6级,同轴度0.012mm以内,保障多通道阵列耦合一致性(FA光纤阵列配套刚需) ;

4. 自研研磨设备:子公司凤凰光腾MT/MPO光纤连接器全自动研磨设备获光通信行业创新奖,光纤端面加工自研,打通光纤耦合后端制程。

二、产业化落地(AR同源工艺平移CPO,已小批量送样)

1. AR光波导先行量产验证:吉安PVG偏振光波导中试线投产,年产5万片光波导,良率80%+;耦入耦出同源工艺经过AR规模化验证,光路原理1:1复用CPO无源耦合件(光栅耦合透镜、阵列耦出棱镜);

2. 产品形态:可量产三类CPO无源件

- 光栅耦入透镜(硅光芯片垂直耦合)

- 多路分光棱镜组件

- 二维阵列耦出棱镜(FAU光纤阵列对接)

3. 客户侧:依托中电科+海康体系,同步向头部光模块厂送样CPO耦合光学件;原有华为AR光波导供货合作,光学品质经过终端大厂验证。

三、短板边界(客观区分能力上限)

1. 只做无源,完全不碰有源:无激光器、硅光PIC芯片、光电封装工艺,只做芯片与光纤中间的光学耦合零件;

2. CPO整机/光引擎不生产:仅供应零部件,不做光引擎组装;

3. 光波导晶圆不自研:玻璃/硅基波导晶圆外购,只做波导外围耦入耦出光学元器件。

四、一句话总结

国内极少数同时具备「全链路耦入-分光-耦出专利+精密光学量产工艺+AR工艺验证」的无源光互连厂商;做CPO无源耦合件技术成熟,