上云资讯 - 来上云吧，企业上云一站式服务

2025-03-21 10:37:26 406人关注

硅基流动宣布DeepSeek-R1&V3 API支持批量推理价格暴降75%

硅基流动 SiliconCloud 平台即日起正式推出 DeepSeek-R1& V3API 的批量推理（Batch Inference）功能。用户现在可以通过批量 API 向 SiliconCloud 发送请求，摆脱实时推理速率的限制，并在预期24小时内完成大规模数据处理任务。

2025-02-12 16:26:33 949人关注

字节跳动豆包大模型团队今日宣布，成功研发出全新稀疏模型架构UltraMem，该架构有效解决了MoE（混合专家）模型推理时的高额访存问题，推理速度较MoE提升2-6倍，推理成本最高可降低83%。这一突破性进展为大模型的高效推理开辟了新路径。