喜报!芯展速「智展AI方案」入选2026算力基础设施高质量发展优秀案例

 

 

近日,由中通企协云数据专委会(CACE-CDPC)组织的「2026算力基础设施高质量发展优秀案例」评选结果正式公布。芯展速科技(北京)有限公司申报的 《基于智展 AI 方案的疾控中心 DeepSeek 大模型本地私有化部署与公共卫生领域微调项目》 ,从众多申报案例中脱颖而出,成功入选 「新技术应用案例」。

 

芯展速产品VP-许玮(左5)上台领奖

 

5月27日,芯展速将出席 DCIC 2026(第15届)数据中心产业发展大会。芯展速产品副总裁 - 许玮代表芯展速上台领取荣誉证书。本次获奖,标志着行业权威对芯展速「智展 AI 方案」技术路线及落地能力的高度认可。

 

技术突破:

存储-计算融合架构,打破显存墙

在传统 AI 训练架构中,GPU 显存容量是大模型本地化微调的主要瓶颈。以 70B 参数模型为例,常规全参数微调需8至16张高端 GPU,硬件投入高达数百万元,且对机房空间、电力容量有严苛要求。

同时,疾控中心的数据涉及大量公民健康信息及国家安全敏感信息,依法不得上公有云,必须本地私有化部署。

 

芯展速产品VP-许玮(左4)上台领奖

「芯展速智展 AI 训推一体机」采用自主研发的智展 AI 训推方案,仅部署2张 GPU + 2张智展 AI 加速卡,通过中间件将企业级 NAND 闪存虚拟化为 GPU 可寻址的扩展内存,实现模型参数、优化器状态、激活值等数据的自动卸载与透明访问。

 

关键成效:

算力集约化,安全本地化

项目落地于某省级疾病预防控制中心,覆盖传染病监测预警、流行病学调查、应急处置决策等核心业务。

 

具体成效如下:

• 硬件成本:极优条件下整体投入较传统方案降低约80%(从数百万元级降至数十万元级)

• GPU效率:所需 GPU 数量减少75%~87.5%(8-16卡压缩至2卡)

• 隐私保护:设备本地部署,数据安全和用户隐私都得到很好的保护

 

在数据安全方面,全栈设备部署于客户内网,数据治理、模型训练、推理服务均在物理隔离环境中完成,不存在公有云传输链路。

 

智展 AI 中间件采用加密地址映射与访问审计,满足《数据安全法》《个人信息保护法》及卫生健康行业数据分类分级最高要求。

行业价值:

从疾控到更多数据敏感型领域

该案例为公共卫生体系提供了一套轻量级、低成本、高安全的算力基础设施样板,已验证可复制推广至地市级疾控中心、卫生监督所、基层医疗机构。

 

同时,其技术路径同样适用于金融、政务、医疗等数据不能出域的行业,可有效助力「东数西算」工程在垂直行业的纵深落地。

 

未来展望

芯展速将持续优化架构,推动智展 AI 方案与更多国产 GPU、国产 NAND 存储适配,并在多节点协同、线性加速等方面持续迭代,为智能世界构建更集约、更安全、更高效的数据基座。