上云资讯 - 来上云吧，企业上云一站式服务

2025-10-01 08:12:26 15人关注

豆包大模型1.6-vision正式发布，对比上一代综合成本降低约50%

火山引擎官微今日宣布，正式发布豆包大模型1.6-vision。据介绍，豆包大模型1.6-vision是豆包大模型家族首个具备工具调用能力的视觉深度思考模型，拥有更强的通用多模态理解和推理能力，并支持Responses API。

2025-09-30 11:22:42 130人关注

DeepSeek发布V3.2-exp模型，开创性稀疏注意力机制将API 成本降低一半

人工智能公司DeepSeek的研究团队周一宣布，他们发布了一款名为 V3.2-exp 的新实验模型，旨在通过创新的“稀疏注意力”机制，大幅降低长上下文操作的推理成本。这一里程碑式的进展在Hugging Face和GitHub上同步发布，并附有详细的学术论文。

AI

2025-09-26 12:32:30 88人关注

Databricks 推出新技术，助力企业 AI 成本降低高达90倍

在企业 AI 的发展中，除了选择合适的模型和提示词，如何优化提示词同样至关重要。Databricks 近期推出的 Agent Bricks 技术致力于解决这一难题，并在此基础上进一步改善了提示优化技术。该公司今天发布的新研究显示，其 GEPA（生成进化提示适应）技术在提示优化方面实现了质的飞跃，帮助企业将模型的运营成本降低多达90倍。

AI

2025-09-04 13:22:41 235人关注

Meta 推出 DeepConf 技术，智能平衡大型语言模型的推理成本与准确性

近日，Meta AI 联合加州大学圣地亚哥分校（UCSD）推出了一种名为 Deep Think with Confidence（DeepConf）的新技术，旨在帮助企业在大语言模型（LLM）的复杂推理任务中，有效降低算力成本的同时保持高准确率。

大语言模型推理优化 DeepConf 技术解析 LLM 算力成本降低复杂推理任务效率提升 Meta AI 与 UCSD 合作研究企业级 AI 应用优化

2025-07-02 09:44:25 175人关注

微软推出 MAI-DxO AI 系统，医疗诊断准确率提升四倍

微软近日发布了一款全新的 AI 系统 MAI-DxO，旨在显著提升复杂医疗病例的诊断准确性。据悉，该系统的诊断准确率是经验丰富医生的四倍，同时能够将医疗成本降低近70%。这一技术通过一个新的基准测试进行评估，模拟了真实的逐步诊断过程。

微软MAI-DxO AI医疗诊断系统医疗AI诊断准确率医疗成本降低技术复杂病例诊断基准测试

2025-06-10 10:24:35 88人关注

亚马逊云科技发布量子计算芯片 Ocelot：纠错成本降低90%

亚马逊云科技（AWS）正式宣布推出其首款量子计算芯片“Ocelot”，标志着其在量子计算领域的重大进展。与当前主流方法相比，Ocelot 芯片能够将量子纠错的成本降低高达90%。这一创新成果由位于加州理工学院的 AWS 量子计算中心团队研发，并已在权威学术期刊《自然》(Nature)上发表相关研究论文。

亚马逊量子计算芯片量子计算芯片Ocelot 亚马逊量子计算技术量子计算芯片新闻 Ocelot芯片技术解析

2025-06-08 14:11:37 105人关注

文生图模型Ideogram 2a 震撼发布：速度翻倍、成本减半，英文排版媲美人类设计

2025年2月27日，人工智能图像生成服务 Ideogram 迎来了备受瞩目的更新，其最新模型“Ideogram2a”正式上线。这一新模型不仅在生成速度上实现了显著提升，同时成本降低了一半，再次巩固了 Ideogram 在文生图（Text-to-Image）领域的领先地位。

ideogram 2a发布 AI字体设计英文排版速度优化 AI排版成本降低 ideogram 2a新特性

2025-05-10 10:14:36 191人关注

Gemini API推出隐式缓存功能，开发者成本降低75%

Gemini API推出隐式缓存（Implicit Caching）功能，为开发者带来显著的成本优化体验。新功能无需开发者手动创建缓存，当请求与先前请求共享共同前缀时，系统将自动触发缓存命中，提供高达75%的Token折扣。此更新已覆盖Gemini2.5Pro和2.5Flash模型，进一步提升了AI开发的成本效益。官方详情可参考:https://developers.googleblog.com

Gemini API 隐式缓存开发者成本 API优化缓存技术

2025-03-30 12:35:14 127人关注

李彦宏谈训练下一代大模型当前应聚焦技术进步和成本降低

2025年2月11日，在阿联酋迪拜举办的World Governments Summit峰会上，百度创始人李彦宏与阿联酋AI部长奥马尔·苏丹·奥拉马进行了深入对话，共同探讨AI基础设施的未来发展趋势。

李彦宏下一代大模型技术大模型技术成本大模型技术发展大模型技术应用

2025-03-29 16:17:21 128人关注

李彦宏谈DeepSeek：称大模型成本每年降低90%以上

近日，世界政府峰会（WGS）在阿联酋迪拜盛大开幕，吸引了全球各界精英的关注。在峰会期间，百度创始人李彦宏与阿联酋AI部长进行了深入对话，共同探讨了AI领域的最新发展趋势。

李彦宏深度求索模型模型成本降低大模型成本优化 AI模型降本增效

2025-03-21 10:37:26 261人关注

硅基流动宣布DeepSeek-R1&V3 API支持批量推理价格暴降75%

硅基流动 SiliconCloud 平台即日起正式推出 DeepSeek-R1& V3API 的批量推理（Batch Inference）功能。用户现在可以通过批量 API 向 SiliconCloud 发送请求，摆脱实时推理速率的限制，并在预期24小时内完成大规模数据处理任务。

DeepSeek R1 V3 API 批量推理 API价格下调 DeepSeek R1 V3价格优化大模型推理成本降低

2025-03-20 16:24:39 189人关注

谷歌开源新一代多模态模型 Gemma-3：性能卓越、成本降低 10 倍

谷歌 CEO 桑达尔・皮查伊（Sundar Pichai）在一场发布会上宣布，谷歌开源了最新的多模态大模型 Gemma-3，该模型以低成本、高性能为特点，备受关注。

Google Gemma 3 多模态模型模型性能优化成本效益分析 Gemma 3应用场景

2025-03-13 10:23:15 354人关注

国内首次！百度智能云成功点亮昆仑芯三代万卡集群大幅降低单位算力成本

百度智能云最近成功点亮了国内首个自研的昆仑芯三代万卡集群。这一里程碑式的突破不仅标志着百度在人工智能算力领域迈出了重要一步，同时也为整个行业提供了新的发展思路。随着科技的不断进步，算力的提升对于支持大规模模型的训练和应用显得尤为关键。

百度云昆仑芯片昆仑芯片集群百度云成本优化云计算成本降低 AI芯片集群优化

2025-02-12 16:26:33 590人关注

字节跳动豆包UltraMem架构将大模型推理成本降低83%

字节跳动豆包大模型团队今日宣布，成功研发出全新稀疏模型架构UltraMem，该架构有效解决了MoE（混合专家）模型推理时的高额访存问题，推理速度较MoE提升2-6倍，推理成本最高可降低83%。这一突破性进展为大模型的高效推理开辟了新路径。

字节跳动豆包大模型 UltraMem技术推理成本优化大模型推理优化 AI推理成本降低

2025-02-06 10:43:44 1583人关注

谷歌重磅发布Gemini 2.0全系列模型三款模型性能、成本双双突破

谷歌扩展了其人工智能模型家族，推出了三款新版本的 Gemini2.0模型，分别为基础版 Gemini2.0Flash、经济版 Gemini2.0Flash-Lite 以及实验版 Gemini2.0Pro。这些新模型旨在满足不同的使用需求，并在性能和成本之间提供多样化的平衡。

Google Gemini 2.0模型大模型性能突破大模型成本优化 Google Gemini 2.0性能提升 Google Gemini 2.0成本降低

2025-01-28 10:44:35 402人关注

国产开源大模型 DeepSeek R1 发布，性能超越o1模、成本降90%

正文:近期，中国的 DeepSeek 团队重磅推出了其最新开源大模型 R1，受到了广泛关注。R1模型的性能表现极其出色，在多项测试中均超越了 OpenAI 的 o1模型，尤其是在数学和编程方面的评估中表现优异。

DeepSeek R1 性能优化成本降低大模型性能提升大模型成本控制

2025-01-22 17:30:28 216人关注

OpenAI开放满血o1模型API：成本降低60% 新增高级视觉处理能力

在为期12个工作日的连续直播活动中，OpenAI在第9天面向开发者发布了o1模型的API，并宣布对实时API进行重大升级，支持WebRTC技术。

OpenAI O1模型 API成本优化 OpenAI API降价 AI模型成本控制 OpenAI最新模型发布

2025-01-17 18:41:40 177人关注

新的Transformer加速技术FlashAttention-3发布成本直线下降

全新的Transformer加速技术FlashAttention-3震撼发布啦!这可不仅仅是个升级，它预示着咱们的大型语言模型（LLMs）的推理速度直线上升和成本的直线下降!

Transformer FlashAttention 3 成本降低注意力机制优化模型训练效率提升深度学习技术

2025-01-14 00:42:14 136人关注

Zyphra推小语言模型Zamba2-2.7B：速度提高一倍，内存成本降低27%

最近，Zyphra 公司发布了全新的 Zamba2-2.7B 语言模型，这一发布在小型语言模型的发展史上具有重要意义。新模型在性能和效率方面取得了显著提升，它的训练数据集达到了大约3万亿个标记，这使得它在性能上可以与 Zamba1-7B 及其他领先的7B 模型相媲美。

Zyphra Zamba2 2.7B 模型速度优化内存成本优化 AI模型性能提升轻量级大模型应用

2025-01-05 18:30:35 316人关注

腾讯发布“混元Turbo”模型：推理成本降低50% 效率提升100%

在2024年腾讯全球数字生态大会上，腾讯公司副总裁兼云业务总裁邱跃鹏对外宣布——腾讯混元Turbo大模型的正式亮相。

腾讯混元大模型大模型推理成本优化混元Turbo模型腾讯AI模型优化大模型成本降低方案

- 上云资讯 -

豆包大模型1.6-vision正式发布，对比上一代综合成本降低约50%

DeepSeek发布V3.2-exp模型，开创性稀疏注意力机制将API 成本降低一半

Databricks 推出新技术，助力企业 AI 成本降低高达90倍

Meta 推出 DeepConf 技术，智能平衡大型语言模型的推理成本与准确性

微软推出 MAI-DxO AI 系统，医疗诊断准确率提升四倍

亚马逊云科技发布量子计算芯片 Ocelot：纠错成本降低90%

文生图模型Ideogram 2a 震撼发布：速度翻倍、成本减半，英文排版媲美人类设计

Gemini API推出隐式缓存功能，开发者成本降低75%

李彦宏谈训练下一代大模型当前应聚焦技术进步和成本降低

李彦宏谈DeepSeek：称大模型成本每年降低90%以上

硅基流动宣布DeepSeek-R1&V3 API支持批量推理价格暴降75%

谷歌开源新一代多模态模型 Gemma-3：性能卓越、成本降低 10 倍

国内首次！百度智能云成功点亮昆仑芯三代万卡集群大幅降低单位算力成本

字节跳动豆包UltraMem架构将大模型推理成本降低83%

谷歌重磅发布Gemini 2.0全系列模型三款模型性能、成本双双突破

国产开源大模型 DeepSeek R1 发布，性能超越o1模、成本降90%

OpenAI开放满血o1模型API：成本降低60% 新增高级视觉处理能力

新的Transformer加速技术FlashAttention-3发布成本直线下降

Zyphra推小语言模型Zamba2-2.7B：速度提高一倍，内存成本降低27%

腾讯发布“混元Turbo”模型：推理成本降低50% 效率提升100%

推荐阅读

上云服务

- 上云资讯 -

豆包大模型1.6-vision正式发布，对比上一代综合成本降低约50%

DeepSeek发布V3.2-exp模型，开创性稀疏注意力机制 将API 成本降低一半

Databricks 推出新技术，助力企业 AI 成本降低高达90倍

Meta 推出 DeepConf 技术，智能平衡大型语言模型的推理成本与准确性

微软推出 MAI-DxO AI 系统，医疗诊断准确率提升四倍

亚马逊云科技发布量子计算芯片 Ocelot：纠错成本降低90%

文生图模型Ideogram 2a 震撼发布：速度翻倍、成本减半，英文排版媲美人类设计

Gemini API推出隐式缓存功能，开发者成本降低75%

李彦宏谈训练下一代大模型 当前应聚焦技术进步和成本降低

李彦宏谈DeepSeek：称大模型成本每年降低90%以上

硅基流动宣布DeepSeek-R1&V3 API支持批量推理 价格暴降75%

​谷歌开源新一代多模态模型 Gemma-3：性能卓越、成本降低 10 倍

国内首次！百度智能云成功点亮昆仑芯三代万卡集群 大幅降低单位算力成本

字节跳动豆包UltraMem架构将大模型推理成本降低83%

谷歌重磅发布Gemini 2.0全系列模型 三款模型性能、成本双双突破

​国产开源大模型 DeepSeek R1 发布，性能超越o1模、成本降90%

OpenAI开放满血o1模型API：成本降低60% 新增高级视觉处理能力

新的Transformer加速技术FlashAttention-3发布 成本直线下降

Zyphra推小语言模型Zamba2-2.7B： 速度提高一倍，内存成本降低27%

腾讯发布“混元Turbo”模型：推理成本降低50% 效率提升100%

推荐阅读

上云服务

DeepSeek发布V3.2-exp模型，开创性稀疏注意力机制将API 成本降低一半

李彦宏谈训练下一代大模型当前应聚焦技术进步和成本降低

硅基流动宣布DeepSeek-R1&V3 API支持批量推理价格暴降75%

谷歌开源新一代多模态模型 Gemma-3：性能卓越、成本降低 10 倍

国内首次！百度智能云成功点亮昆仑芯三代万卡集群大幅降低单位算力成本

谷歌重磅发布Gemini 2.0全系列模型三款模型性能、成本双双突破

国产开源大模型 DeepSeek R1 发布，性能超越o1模、成本降90%

新的Transformer加速技术FlashAttention-3发布成本直线下降

Zyphra推小语言模型Zamba2-2.7B：速度提高一倍，内存成本降低27%