LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-07-04 11:45:13 324人关注

开源 DeepSeek R1 增强版:推理效率提升200%,降低成本

近日,德国知名技术咨询公司 TNG 发布了 DeepSeek 的增强版 ——DeepSeek-TNG-R1T2-Chimera,标志着深度学习模型在推理效率和性能上的又一次重大突破。这一新版本不仅在推理效率上提升了200%,而且通过创新的 AoE 架构显著降低了推理成本。

深度学习模型 DeepSeek-TNG-R1T2-Chimera AoE架构 推理效率提升 推理成本优化 德国TNG技术咨询

2025-02-12 16:26:33 429人关注

字节跳动豆包UltraMem架构将大模型推理成本降低83%

字节跳动豆包大模型团队今日宣布,成功研发出全新稀疏模型架构UltraMem,该架构有效解决了MoE(混合专家)模型推理时的高额访存问题,推理速度较MoE提升2-6倍,推理成本最高可降低83%。这一突破性进展为大模型的高效推理开辟了新路径。

字节跳动 豆包大模型 UltraMem技术 推理成本优化 大模型推理优化 AI推理成本降低

2025-01-05 18:30:35 192人关注

腾讯发布“混元Turbo”模型:推理成本降低50% 效率提升100%

在2024年腾讯全球数字生态大会上,腾讯公司副总裁兼云业务总裁邱跃鹏对外宣布——腾讯混元Turbo大模型的正式亮相。

腾讯混元大模型 大模型推理成本优化 混元Turbo模型 腾讯AI模型优化 大模型成本降低方案

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10