4月17日,浪潮信息主办的"数海同舟"存储生态伙伴大会圆满落幕。本届大会上,浪潮信息面向行业首次推出AI数据平台A9000系列产品。为应对Agent AI时代在数据存取效率、智能体记忆与上下文调度等方面的多重挑战,A9000系列围绕AI原生并行架构进行深度设计,融合端到端GDS直通、AI原生KV Cache等核心技术突破,在单节点上即可实现百GB/s级带宽与百微秒级超低时延,构筑面向AI场景的高性能数据处理底座。同时,A9000系列针对Agent Memory高频调用场景做了定向优化,从根源上解决智能体因记忆召回延迟导致的"逻辑断片"痛点,为Agent AI规模化落地打造坚实的高性能存储基座。
在典型AI推理测试环境下,A9000系列可实现TTFT降低97%、TPOT降低96%、Token吞吐量提升超20倍,帮助用户提升GPU利用率、优化推理成本,加快智能应用规模化落地。

Agent AI走向生产,存储角色正在被重新定义
随着Agent AI从技术探索走向生产应用,企业对存储的关注重点正在发生变化。在多任务协同、多轮交互和长上下文推理场景中,存储已不再只是承载数据的后台设施,而是直接影响首Token生成速度、连续解码效率以及上下文调用连贯性的关键一环。尤其在Agent应用中,Memory正在成为任务衔接与决策连续性的重要基础,底层若不能持续提供低时延、高带宽的数据供给,就容易带来响应变慢、记忆调用不畅等问题,进而影响业务处理效率与用户体验。
与此同时,企业推动AI规模化落地时,推理成本与数据安全也正成为新的核心诉求。一方面,大量KV Cache带来的显存占用与重复计算开销,要求底层存储具备更强的数据组织、缓存与复用能力,以支撑上下文高效调用,降低单次Token成本并提升系统并发效率;另一方面,在多业务并行、多角色协同的生产环境中,清晰的资源边界、完善的权限管理和数据隐私安全保障,也正在成为AI系统进入核心业务流程的前提。这意味着,存储的角色正在从“存数据”进一步走向“供数据、管上下文、保安全”的数据平台。
浪潮信息发布AI数据平台A9000系列,打造Agent AI时代高性能存储基座
围绕企业级Agent应用对持续记忆、推理效率及数据安全可信的多重诉求,浪潮信息AI数据平台A9000系列以AI原生并行架构设计为核心,针对Agent Memory高频访问进行专项优化,结合端到端GDS能力提供单节点百GB/s带宽与百μs级低时延;同时内置AI原生KV Cache,将Token吞吐量提升超20倍;支持基于租户的统一资源管理、精细化权限管理及数据完整性校验,推动存储从传统数据承载介质,升级为深度参与推理过程、支撑多业务安全并行、保障结果可信的数据平台。

// 全用户态AI原生并行架构:支撑Agent记忆高效调用
针对Agent Memory高频访问、上下文快速调取等需求,A9000系列从底层软件栈到硬件链路进行了全方位重构。通过全链路免锁与零拷贝技术,A9000系列大幅缩短存储访问路径,支持海量上下文状态的实时检索与瞬时唤醒,确保记忆“随用随取”;同时,在数据供给通路上进行深度优化,消除I/O等待,确保Agent在多轮交互中能快速调取历史记忆,彻底规避因数据供给不及时导致的逻辑断片,显著提升业务决策的精准度与智能化水平。具体来讲,A9000系列可提供单节点百GB/s带宽、百万IOPS和百μs级时延,使TTFT降低达97%,为企业级Agent应用构建低时延、高带宽的AI高性能存储平台。
// 内置AI原生KV Cache:优化推理的“Token经济性”
围绕推理场景中显存占用高、重复计算多等问题,A9000系列内置AI原生KV Cache能力,使存储从传统的数据承载介质进化为参与推理过程的关键。通过创新 KV Cache 卸载与重用技术,A9000系列可实现上下文数据的跨请求复用,大幅减少重复计算带来的算力损耗。在典型推理测试环境下,实现Token吞吐量提升超20倍,并显著降低TPOT,帮助企业在保障服务质量的同时,大幅优化单Token推理成本。
// 多维强隔离+精细化权限管理:建立数据访问的“安全防线”
面向AI生产环境中多业务并行、多角色协同的需求,A9000系列提供基于租户的多维强隔离架构,实现数据、访问、配置的三重物理级隔离,保障多业务场景下的数据安全与访问边界;同时,基于Zero-trust安全架构,依托ACL目录权限隔离、全流程审计等关键能力,实现更细颗粒度的权限管理与过程可追溯,进一步守护用户数据隐私安全与业务运行可信。
在Agent AI浪潮的推动下,底层基础设施正经历从"数据湖"到"数据河"、从"算力集群"到"算力工厂"的深刻变革。浪潮信息A9000系列立足于企业级推理场景的实际需求,对数据流通链路、上下文管理机制与数据安全体系进行一体化重构,为各行业用户提供了一套更契合智能体应用演进趋势的数据基础设施方案,有效推动智能应用在更多真实生产场景中的快速部署与规模化扩展。