在AI芯片赛道竞争白热化的今天,深圳AI龙头企业云天励飞在世界人工智能大会上抛出一枚”重磅炸弹”——宣布全面聚焦AI芯片领域,披露全新一代AI推理芯片产品矩阵及未来三年商用路线图。这家深耕NPU研发10年的企业,计划到2028年将单芯片算力提升至数千TOPS,剑指万亿参数大模型推理市场。云天励飞如何凭借”纯血国产工艺”和独创的”算力积木”架构突围?这场AI芯片国产化攻坚战又将如何改写行业格局?

一、十年磨一剑:从Edge10到深穹X6000的进化之路
云天励飞的AI芯片布局始于2015年,经过五代技术迭代,已形成覆盖端、边、云的完整产品矩阵:
- 深界Edge10平台
- 采用自研第四代NPU Nova 400,高效支持Transformer架构
- 已适配DeepSeek大模型,推理一体机吞吐量达500 tokens/s
- 最小封装版本Edge10C支持C2C算力级联,能效比突出
- 深穹X6000加速卡
- 基于Edge200打造,支持千亿参数大模型推理
- 最高算力达256TOPS,已落地Qwen、DeepSeek推理一体机
“我们的产品路线图显示,下一代深穹芯片峰值算力将突破512TOPS。”云天励飞CTO李爱军透露,这将为万亿参数大模型提供坚实算力基础。
二、”算力积木”架构:突破国产工艺限制的杀手锏
云天励飞的核心竞争力在于其独创的”算力积木”架构,通过四大技术创新实现算力跃升:
- D2D Chiplet技术
- 实现单芯片算力增强,突破国产工艺制程限制
- 支持3D内存混合键合,内存带宽提升10倍
- NB-Mesh互连技术
- 采用多维Full Mesh互连,通讯效率提升300%
- 直接内存语义访问,降低延迟40%
- 异构计算单元
- 第五代NPU Nova500计算效率提升5倍
- 原生态FP8/FP4支持,能效比提升3倍
“我们的技术路线图显示,第二代’算力积木’架构将带来20倍的性能提升。”李爱军强调,这将为国产大模型推理提供”中国方案”。
三、全栈自主可控:从芯片到软件的生态布局
云天励飞构建了完整的AI推理生态体系:
- 软件适配
- 完成主流推理框架适配
- 与智源研究院合作开发异构推理基础设施
- 互联互通
- 研发NB-Link技术,支持PCIe通用接口
- CPU/NPU互连带宽达1TB/s
- 国产化认证
- 深界DeepEdge10通过广五所C级认证
- 板级方案实现100%国产化率
“我们已形成从芯片设计到软件栈的全栈自主可控能力。”云天励飞董事长陈宁表示,这是应对国际竞争的关键优势。
四、未来展望:标准制定与生态建设
面对AI推理芯片市场的爆发式增长,云天励飞正积极布局:
- 标准制定
- 建议ITU牵头制定AI推理芯片国际标准
- 推动算力网络标准化建设
- 生态构建
- 与上下游企业共建开放生态
- 拓展AI芯片在更多场景的应用
“我们的目标是打造具有国际竞争力的AI芯片国家队。”陈宁说。
三大核心判断
- 技术突破:云天励飞通过”算力积木”架构实现国产工艺下的算力跃升
- 产品布局:从Edge10到深穹X6000,覆盖全场景AI推理需求
- 生态战略:标准制定与生态建设双管齐下,抢占行业制高点
“云天励飞的布局展现了国产AI芯片的突围路径。”行业分析师指出,”在AI大模型时代,算力就是生产力,云天励飞的技术路线具有标杆意义。”
随着AI推理芯片市场进入爆发期,云天励飞能否凭借全栈自主可控技术实现弯道超车?这场国产芯片的攻坚战将如何影响全球AI产业格局?答案正在书写中。