微信扫码
添加专属顾问
2024-12-15 09:22:22 85人关注
月之暗面科技有限公司与清华大学MADSys实验室联合发布了一项名为Mooncake的开源项目,旨在共建以KVCache为中心的大模型推理架构。2024年6月,双方曾联合发布Kimi底层的Mooncake推理系统设计方案,该方案基于PD分离和以存换算架构,显著提升了推理吞吐量,受到业界广泛关注。
月饼推理架构 推理架构技术 大模型推理架构 AI推理架构设计 月饼架构技术解析