上云资讯 - 来上云吧，企业上云一站式服务

2025-07-16 15:32:13 1151人关注

Unsloth AI发布1.8bit量化Kimi K2模型，显著降低部署成本

7月14日，Unsloth AI宣布成功将Moonshot AI的Kimi K2模型量化为1.8bit版本，大幅压缩模型体积并降低部署成本。根据AIbase报道，这一技术突破使Kimi K2从原始的1.1TB缩减至245GB，体积减少约80%，同时保持了全部代码测试性能。此举被视为开源AI领域的重要进展，引发了业界广泛关注。

Kimi K2模型量化 1.8bit量化技术模型体积压缩开源AI技术进展 Unsloth AI技术突破 AI模型部署成本优化

2025-07-10 11:12:21 305人关注

微软利用 AI 技术节省5 亿美元成本并再度裁员近万人

微软首席商务官 Judson Althoff 在近日的公开讲话中表示，人工智能（AI）技术正在大幅提升微软内部各个部门的运营效率，包括销售、客户服务和软件工程等领域。通过实施 AI 工具，微软在去年的呼叫中心运营中节省了超过5亿美元的成本，这一变化不仅提高了员工的工作效率，还增强了客户的满意度。

微软AI技术应用 AI提升运营效率 AI呼叫中心成本优化微软AI工具实施案例 AI对客户满意度的影响

2025-07-04 11:45:13 710人关注

开源 DeepSeek R1 增强版:推理效率提升200%，降低成本

近日，德国知名技术咨询公司 TNG 发布了 DeepSeek 的增强版 ——DeepSeek-TNG-R1T2-Chimera，标志着深度学习模型在推理效率和性能上的又一次重大突破。这一新版本不仅在推理效率上提升了200%，而且通过创新的 AoE 架构显著降低了推理成本。

深度学习模型 DeepSeek-TNG-R1T2-Chimera AoE架构推理效率提升推理成本优化德国TNG技术咨询

2025-06-19 14:44:10 438人关注

OpenAI 重磅推出 ChatGPT 企业版折扣，折扣幅度从10%到20%

OpenAI 宣布将为购买其 ChatGPT 企业版的客户提供新一轮的折扣。这次优惠针对的是那些捆绑购买额外产品的企业用户，折扣幅度从10% 到20% 不等，吸引了众多企业的关注。这一举措不仅能够帮助企业降低成本，也进一步拓展了 OpenAI 在企业市场的影响力。

ChatGPT企业版折扣 OpenAI企业优惠活动企业AI工具成本优化 OpenAI市场拓展策略企业AI解决方案采购

2025-06-18 16:40:20 204人关注

Akamai 利用 AI 技术和 Kubernetes 平台实现云成本节省 70%

在当前的数字时代，云计算的开销持续高企，企业在计算资源的使用效率上普遍存在浪费。根据最新统计，预计今年企业在不必要的云开销上将浪费高达445亿美元。Akamai Technologies 作为一家大型的网络安全和内容交付服务提供商，面临着复杂的多云基础设施以及严格的安全合规要求，因此需要寻找有效的解决方案来优化云成本。

云计算成本优化企业云资源浪费多云基础设施管理云安全合规要求 Akamai Technologies 云解决方案

2025-05-29 16:45:27 231人关注

ScaleOT框架亮相AAAI 2025：提升隐私保护50%，降算力成本90%

近日，在全球人工智能顶级学术会议AAAI2025期间，蚂蚁数科、浙江大学、利物浦大学和华东师范大学联合团队提出创新的跨域微调（offsite-tuning）框架——ScaleOT。该框架能在模型性能无损前提下，将隐私保护效果提升50%，与知识蒸馏技术相比，算力消耗显著降低90%，为百亿级参数模型的跨域微调提供高效轻量化方案，论文因创新性入选AAAI的oral论文(本届大会近13000篇投稿，口头报告比例仅4.6%)。

ScaleOT框架隐私保护计算计算成本优化 ScaleOT框架应用场景隐私保护计算技术

2025-05-09 10:12:11 244人关注

阿里巴巴开源 ZeroSearch 搜索引擎：训练成本大幅降低 80%

近日，阿里巴巴推出了一款名为 ZeroSearch 的开源创新大模型搜索引擎，这一新工具通过强化学习框架，极大地提高了搜索能力，并且在训练过程中不需要与真实搜索引擎互动。ZeroSearch 的核心优势在于它能够利用大型预训练模型的知识，快速生成相关内容，并且可以动态控制生成内容的质量。

阿里巴巴零成本研究降本增效成本优化企业成本管理

2025-03-29 16:17:21 269人关注

李彦宏谈DeepSeek：称大模型成本每年降低90%以上

近日，世界政府峰会（WGS）在阿联酋迪拜盛大开幕，吸引了全球各界精英的关注。在峰会期间，百度创始人李彦宏与阿联酋AI部长进行了深入对话，共同探讨了AI领域的最新发展趋势。

李彦宏深度求索模型模型成本降低大模型成本优化 AI模型降本增效

2025-03-17 08:10:29 233人关注

亚马逊 CEO：AI 成本因 DeepSeek 技术大幅降低

近日，亚马逊首席执行官安迪・贾西在与分析师的电话会议中谈到了人工智能（AI）技术的发展及其成本问题。他表示，随着新技术的不断涌现，特别是 DeepSeek 等模型的推出，人工智能推理的成本将会显著下降。这一变化将使得更多企业能够轻松将 AI 应用于其业务中，尤其是在推理和生成式 AI 的领域。

Amazon CEO AI成本优化 DeepSeek技术云计算成本控制 AI投资回报率

2025-03-13 10:23:15 592人关注

国内首次！百度智能云成功点亮昆仑芯三代万卡集群大幅降低单位算力成本

百度智能云最近成功点亮了国内首个自研的昆仑芯三代万卡集群。这一里程碑式的突破不仅标志着百度在人工智能算力领域迈出了重要一步，同时也为整个行业提供了新的发展思路。随着科技的不断进步，算力的提升对于支持大规模模型的训练和应用显得尤为关键。

百度云昆仑芯片昆仑芯片集群百度云成本优化云计算成本降低 AI芯片集群优化

2025-03-06 12:45:24 250人关注

巴西初创公司Carecode推出AI智能体，力图降低医疗成本

随着人工智能在医疗领域的潜力日益受到关注，巴西初创公司 Carecode 也在这一趋势中崭露头角。Carecode 专注于利用人工智能智能体处理医疗预约前后的各种任务，旨在降低医疗费用并改善医疗效果。

巴西创业公司 AI医疗保健医疗成本优化 CareCode AI技术巴西医疗创新

2025-02-12 16:26:33 950人关注

字节跳动豆包UltraMem架构将大模型推理成本降低83%

字节跳动豆包大模型团队今日宣布，成功研发出全新稀疏模型架构UltraMem，该架构有效解决了MoE（混合专家）模型推理时的高额访存问题，推理速度较MoE提升2-6倍，推理成本最高可降低83%。这一突破性进展为大模型的高效推理开辟了新路径。

字节跳动豆包大模型 UltraMem技术推理成本优化大模型推理优化 AI推理成本降低

2025-02-06 10:43:44 2544人关注

谷歌重磅发布Gemini 2.0全系列模型三款模型性能、成本双双突破

谷歌扩展了其人工智能模型家族，推出了三款新版本的 Gemini2.0模型，分别为基础版 Gemini2.0Flash、经济版 Gemini2.0Flash-Lite 以及实验版 Gemini2.0Pro。这些新模型旨在满足不同的使用需求，并在性能和成本之间提供多样化的平衡。

Google Gemini 2.0模型大模型性能突破大模型成本优化 Google Gemini 2.0性能提升 Google Gemini 2.0成本降低

2025-02-05 10:26:19 271人关注

超贵！OpenAI o3 模型单次查询竟高达 1000 美元！

OpenAI 最近推出的 o3AI 模型被认为是其最强大的人工智能产品，但其运行成本却令人咋舌，单次任务费用超过1000美元。

OpenAI O3模型大模型查询成本 O3模型价格 AI模型查询费用 OpenAI模型成本优化

2025-01-27 19:36:15 405人关注

边缘计算创企云锦微完成天使轮:将AI成本从百万降至十万

据智能涌现消息，具身智能体操作系统开发商云锦微近日宣布完成数百万元天使轮融资，由科大讯飞领投。本轮融资将用于核心技术产品研发和市场生态建设。

边缘计算云瑾微天使轮融资 AI成本优化 AI降本增效

2025-01-23 09:38:25 266人关注

抖音副总裁澄清疑掀大模型价格战：通过技术创新来降低使用成本

今日，抖音副总裁李亮就有关字节跳动可能掀起大模型价格战的传闻发表了看法。他在社交媒体上明确表示，这并非价格战，而是通过技术创新来降低 AI 模型的使用成本。

抖音AI降本增效 AI成本优化抖音VP谈AI成本 AI降本技术抖音AI技术应用

2025-01-22 17:30:28 309人关注

OpenAI开放满血o1模型API：成本降低60% 新增高级视觉处理能力

在为期12个工作日的连续直播活动中，OpenAI在第9天面向开发者发布了o1模型的API，并宣布对实时API进行重大升级，支持WebRTC技术。

OpenAI O1模型 API成本优化 OpenAI API降价 AI模型成本控制 OpenAI最新模型发布

2025-01-14 00:42:14 267人关注

Zyphra推小语言模型Zamba2-2.7B：速度提高一倍，内存成本降低27%

最近，Zyphra 公司发布了全新的 Zamba2-2.7B 语言模型，这一发布在小型语言模型的发展史上具有重要意义。新模型在性能和效率方面取得了显著提升，它的训练数据集达到了大约3万亿个标记，这使得它在性能上可以与 Zamba1-7B 及其他领先的7B 模型相媲美。

Zyphra Zamba2 2.7B 模型速度优化内存成本优化 AI模型性能提升轻量级大模型应用

2025-01-10 10:17:43 326人关注

Anthropic API 推出提示缓存功能：显著降低AI交互成本与延迟

Anthropic API 近日推出了提示缓存功能，开发人员现在可以在API调用之间缓存常用的上下文信息。通过提示缓存，客户能够为Claude模型提供更多的背景知识和示例输出，同时显著降低长提示的成本，减少高达90%的费用，降低高达85%的延迟。

Anthropic API Prompt Caching API成本优化 API延迟优化 Anthropic API性能提升

2025-01-09 04:27:27 292人关注

新兴 AI 公司 Recogni 推出革命性计算方法，降低成本和电力需求

在人工智能的浪潮中，芯片和软件的创新一直是推动行业发展的关键。而今，新兴AI公司Recogni带来了一项革命性的计算方法，这不仅让AI芯片变得更小、更快，还大幅降低了运行成本。

Recogni 革命性计算计算成本优化计算效能提升 AI计算技术

- 上云资讯 -

Unsloth AI发布1.8bit量化Kimi K2模型，显著降低部署成本

微软利用 AI 技术节省5 亿美元成本并再度裁员近万人

开源 DeepSeek R1 增强版:推理效率提升200%，降低成本

OpenAI 重磅推出 ChatGPT 企业版折扣，折扣幅度从10%到20%

Akamai 利用 AI 技术和 Kubernetes 平台实现云成本节省 70%

ScaleOT框架亮相AAAI 2025：提升隐私保护50%，降算力成本90%

阿里巴巴开源 ZeroSearch 搜索引擎：训练成本大幅降低 80%

李彦宏谈DeepSeek：称大模型成本每年降低90%以上

亚马逊 CEO：AI 成本因 DeepSeek 技术大幅降低

国内首次！百度智能云成功点亮昆仑芯三代万卡集群大幅降低单位算力成本

巴西初创公司Carecode推出AI智能体，力图降低医疗成本

字节跳动豆包UltraMem架构将大模型推理成本降低83%

谷歌重磅发布Gemini 2.0全系列模型三款模型性能、成本双双突破

超贵！OpenAI o3 模型单次查询竟高达 1000 美元！

边缘计算创企云锦微完成天使轮:将AI成本从百万降至十万

抖音副总裁澄清疑掀大模型价格战：通过技术创新来降低使用成本

OpenAI开放满血o1模型API：成本降低60% 新增高级视觉处理能力

Zyphra推小语言模型Zamba2-2.7B：速度提高一倍，内存成本降低27%

Anthropic API 推出提示缓存功能：显著降低AI交互成本与延迟

新兴 AI 公司 Recogni 推出革命性计算方法，降低成本和电力需求

推荐阅读

上云服务

- 上云资讯 -

Unsloth AI发布1.8bit量化Kimi K2模型，显著降低部署成本

​微软利用 AI 技术节省5 亿美元成本并再度裁员近万人

开源 DeepSeek R1 增强版:推理效率提升200%，降低成本

OpenAI 重磅推出 ChatGPT 企业版折扣，折扣幅度从10%到20%

​Akamai 利用 AI 技术和 Kubernetes 平台实现云成本节省 70%

ScaleOT框架亮相AAAI 2025：提升隐私保护50%，降算力成本90%

阿里巴巴开源 ZeroSearch 搜索引擎：训练成本大幅降低 80%

李彦宏谈DeepSeek：称大模型成本每年降低90%以上

​亚马逊 CEO：AI 成本因 DeepSeek 技术大幅降低

国内首次！百度智能云成功点亮昆仑芯三代万卡集群 大幅降低单位算力成本

​巴西初创公司Carecode推出AI智能体，力图降低医疗成本

字节跳动豆包UltraMem架构将大模型推理成本降低83%

谷歌重磅发布Gemini 2.0全系列模型 三款模型性能、成本双双突破

超贵！OpenAI o3 模型单次查询竟高达 1000 美元！

边缘计算创企云锦微完成天使轮:将AI成本从百万降至十万

抖音副总裁澄清疑掀大模型价格战：通过技术创新来降低使用成本

OpenAI开放满血o1模型API：成本降低60% 新增高级视觉处理能力

Zyphra推小语言模型Zamba2-2.7B： 速度提高一倍，内存成本降低27%

Anthropic API 推出提示缓存功能：显著降低AI交互成本与延迟

新兴 AI 公司 Recogni 推出革命性计算方法，降低成本和电力需求

推荐阅读

上云服务

微软利用 AI 技术节省5 亿美元成本并再度裁员近万人

Akamai 利用 AI 技术和 Kubernetes 平台实现云成本节省 70%

亚马逊 CEO：AI 成本因 DeepSeek 技术大幅降低

国内首次！百度智能云成功点亮昆仑芯三代万卡集群大幅降低单位算力成本

巴西初创公司Carecode推出AI智能体，力图降低医疗成本

谷歌重磅发布Gemini 2.0全系列模型三款模型性能、成本双双突破

Zyphra推小语言模型Zamba2-2.7B：速度提高一倍，内存成本降低27%