-+ 0.00%
-+ 0.00%
-+ 0.00%

记忆张量科技有限公司与商汤科技大装置团队联合宣布,成功在国产GPGPU集群上实现了业界首个以“记忆—计算—调度”一体化为核心的PD分离商用推理集群,并在真实生产环境中稳定运行。测试数据显示,该方案综合推理性价比达到同代英伟达A100的150%,标志着国产算力体系在大模型商业化落地方面首次具备了体系级竞争力。此次突破为国产算力生态找到了差异化突破路径。PD分离从硬件优化升级为记忆中心的设计范式。在MemOS体系中,分离架构可延伸至行为预测、上下文规划、记忆布局等更高维度,成为整体架构的有机组成部分。这也预示着C端场景正式进入“记忆推理”时代。

智通财经·12/04/2025 12:57:04
语音播报
记忆张量科技有限公司与商汤科技大装置团队联合宣布,成功在国产GPGPU集群上实现了业界首个以“记忆—计算—调度”一体化为核心的PD分离商用推理集群,并在真实生产环境中稳定运行。测试数据显示,该方案综合推理性价比达到同代英伟达A100的150%,标志着国产算力体系在大模型商业化落地方面首次具备了体系级竞争力。此次突破为国产算力生态找到了差异化突破路径。PD分离从硬件优化升级为记忆中心的设计范式。在MemOS体系中,分离架构可延伸至行为预测、上下文规划、记忆布局等更高维度,成为整体架构的有机组成部分。这也预示着C端场景正式进入“记忆推理”时代。