中科曙光高端存储,已经准备好接受AI时代的新考验
2025年FlashNexus 8000在国际存储性能委员会SPC的SPC-1 v3基准测试中登顶。那次打榜中科曙光证明了自身的产品能力也给了市场和客户更多信心。一年后FlashNexus 9000发布。这一次中科曙光没有强调榜单成绩、性能参数而是把银行、医疗等行业的真实应用场景放到了前面。从核心交易系统到关键数据库从海量数据处理到AI负载承载FlashNexus已经在实际的生产环境中发挥价值。在AI强需求的当下高端集中式存储也正走向核心业务支撑能力验证的新阶段。从核心业务到AI负载高端存储需求变了虽然从市场规模来看分布式存储早在2024年就已经超过集中式存储但在核心业务场景中集中式存储依然是一颗“定海神针”。无论是核心交易系统、关键数据库还是虚拟化平台集中式存储仍然占据主导位置。说完不变再看看变化的部分。高端集中式存储在整体市场中的占比正在持续提升。赛迪顾问预测到2025年高端集中式存储的占比已超过60%。这反映出集中式存储开始指向高端AI、金融和医疗成为需求最明显的几个行业。现在用户开始更加关注性能、可靠性、安全以及适配能力。性能的评估不再是越快越好更重要的是做到无论峰值还是低谷延迟都能保持稳定可靠性也不只是简单地多存几份要做到每次写入都必须完整一致和有序。AI需求的快速增长又进一步放大了这种变化。随着AI推理和智能体开始进入生产环境越来越多AI工作负载也开始向集中式存储迁移。以自动驾驶为例每秒都会产生大量感知数据决策系统需要在极短时间内完成从感知、规划到控制的全链路处理这对存储系统的实时性和稳定性要求极高。智能体场景同样如此。此前火爆的“龙虾”类智能体在部分企业早期部署时就曾出现性能波动和延迟问题后续迁移到集中式全闪存架构后整体响应效率和稳定性才逐渐达到业务可用水平。需求变化之外中国集中式存储市场本身也长期面临现实挑战。产业长期面临技术锁定、服务绑定、信任成本“三角困境”三者之间需要维持微妙的平衡一旦某一侧被过度强化另外两侧往往也会随之受到影响。首先是技术锁定。高端集中式存储本身具备很高技术壁垒从底层架构、处理器到核心算法长期以来都集中在少数厂商手中。其次是服务绑定。由于供给侧的稀缺企业在选择供应商时很多时候也等于同时选择了一整套生态体系形成生态捆绑。最后则是信任成本。核心业务系统对于稳定性和连续性的要求极高需求侧可选择空间非常有限。AI的发展正在对存储系统提出比过去更高的要求同时也在重新推动存储技术演进。中科曙光高级副总裁李斌指出随着大模型训练和推理规模持续扩大存储开始越来越深地参与整个AI计算流程。可以预见2027年前后将成为企业和厂商共同的关键窗口期。一边是原有核心系统进入新一轮升级与替换周期另一边则是AI开始加速进入生产环境基础设施能力也随之迎来重构。从性能竞争到体系能力高端存储逻辑升级AI时代到来之后数据的重要性进一步提升存储基础设施也开始面临更高要求。当前高端存储在AI时代主要面临四大束缚第一性能不足性能跟不上需求扩张核心业务效率受限第二可靠性焦虑核心数据可靠性要求更高安全风险增加第三供应链风险国际形势复杂多变核心部件卡脖子第四生态兼容性被厂商封闭生态绑定用户无自主选择权。FlashNexus 9000也正好对应了当前高端存储市场最核心的几类需求。第一极致性能。FlashNexus产品已霸榜全球第一超过一年2026年四控阵列更是实现了性能翻倍增长。FlashNexus 9000集群性能增长近7倍达到2亿IOPS集群规模扩展至256控扩展能力较上代产品提升8倍。单阵列性能也从200万IOPS翻倍至400万IOPS.重删压缩场景下性能从136万IOPS提升至255万IOPS增幅达87.5%。极致性能究竟是如何实现的这背后是独创的“超级隧道”技术在发挥能量。在硬件平台和微控之上通过零中断、零竞争、零拷贝构建直通数据通路有效减少GPU空转。第二安全可靠。FlashNexus 9000的核心优势之一就是可靠性。例如在系统从四控降级到双控、甚至单控运行时依然需要保证核心业务稳定运行。原本512个微控单元可以支撑200万IOPS当系统因故障缩减到256个微控单元后依然能够维持同等级别的业务承载能力。更极端的情况下即便同一RAID组内同时出现4块硬盘故障并叠加三个控制器故障系统后端数据修复依然能够全速运行并能维持100万IOPS的业务能力。中科曙光北京公司总裁助理、集中式存储产品部总经理郭照斌说道这也是中科曙光对于极致可靠性的定义在极端故障场景下依然保证数据不丢失、业务不中断、用户基本无感知。基于这样的设计思路FlashNexus 9000可实现“7个9”级别可靠性并结合高容灾的AA双活Active-Active Dual-Live设计支持构建两地三中心的容灾方案进一步提升到数据中心级容错能力。在数据中心之间网络条件满足的情况下承诺叠加AA能力对整体极限性能的影响也能够控制在20%以内。除了系统级可靠性之外安全可靠也是FlashNexus 9000重点强化的方向。包括内置国产加密处理器、符合国标的数据安全擦除能力以及锁定快照、多维检测等防勒索机制从底层进一步保障关键基础设施的数据安全。第三全栈可控。FlashNexus 9000核心部件实现100%国产尤其是处理器芯片、交换芯片、前端芯片等整体达到国际先进水平不仅有效支撑了系统研制更将实现全面产业化落地。同时软件实现全栈自研核心存储软件拥有自主知识产权所有存储侧软件百分之百自研主机多路径软件和开源多路径全兼容。第四生态开放。原生兼容主流操作系统全量支持主流数据库无缝融入现代化IT架构把选择权真正交给用户不被封闭生态所绑定。中科曙光北京公司副总裁何振表示从去年FlashNexus的双控阵列到今年的四控阵列再加上分布式存储中科曙光已经补上了存储领域的最后一个空白。从跑分到核心业务验证高端存储真正下场FlashNexus 9000主要有6大应用场景。在金融在线业务场景中FlashNexus 9000重点强调高峰业务不卡顿、极端故障下业务无感知以及全链路数据安全加密。金融场景中可实现峰值交易速度提升200%每秒处理30万笔交易时延降低30%。在智慧医院场景中FlashNexus 9000重点保障HIS系统长期稳定运行实现响应提速90%挂号结算无卡顿业务全天候不间断。在数据库存算分离场景中FlashNexus 9000通过端到端RDMA一写多读能够提升数据库性能同时结合存储端秒级快照与快速复制能力实现镜像数据秒级生成生产数据库与镜像数据库可同时访问。在典型数据库场景下数据重删压缩比可达到2倍以上。在通信核心业务场景中FlashNexus 9000结合国产化无损网络能力进一步提升通信业务的数据底座能力与自主可控水平。运营商计费系统中5G计费出账时间可缩短66%压缩至3小时左右。在AI推理场景中FlashNexus 9000原生支持NVMe-oF与GDR协议可对计算节点中的KV Cache进行卸载同时支持KV语义能力直接与GPU协同。KV Cache卸载后长会话场景体验可提升10倍以上单GPU并发吞吐能力提升2至10倍整体硬件成本降低约4至5倍。在电力系统场景中全栈国产适配实现电力数据云纳管异构纳管能力可以兼容原有存量数据减少数据迁移带来的改造成本。同时高并发、低延时支撑调度与电网控制。“在AI工作负载中FlashNexus 9000主要优势在于AI推理。”何振说道。AI产业还处在起步期对于算力和存储的需求会持续放大中科曙光也会不断提升在高端存储领域的解决方案能力。未来AI逐渐进入更多生产场景后存储系统也不只是数据存放平台会进一步向“AI数据工厂”方向发展。所以存储需要具备更大的数据承载能力、更快的数据访问能力以及更智能的数据管理能力。同时围绕不同AI场景存储系统也需要支持更多协议融合、更多数据类型以及更复杂的业务负载。既有“快又稳”的硬实力又有“多面手”的场景支撑中科曙光接下来更重要的任务是进一步拓展市场让全国产高端全闪存存储真正服务于千行百业核心业务向AI应用全速跃迁。