- 上云资讯 -
2025-07-16 15:32:13 352人关注
Unsloth AI发布1.8bit量化Kimi K2模型,显著降低部署成本
7月14日,Unsloth AI宣布成功将Moonshot AI的Kimi K2模型量化为1.8bit版本,大幅压缩模型体积并降低部署成本。根据AIbase报道,这一技术突破使Kimi K2从原始的1.1TB缩减至245GB,体积减少约80%,同时保持了全部代码测试性能。此举被视为开源AI领域的重要进展,引发了业界广泛关注。
Kimi K2模型量化 1.8bit量化技术 模型体积压缩 开源AI技术进展 Unsloth AI技术突破 AI模型部署成本优化
2025-07-10 11:12:21 75人关注
微软利用 AI 技术节省5 亿美元成本并再度裁员近万人
微软首席商务官 Judson Althoff 在近日的公开讲话中表示,人工智能(AI)技术正在大幅提升微软内部各个部门的运营效率,包括销售、客户服务和软件工程等领域。通过实施 AI 工具,微软在去年的呼叫中心运营中节省了超过5亿美元的成本,这一变化不仅提高了员工的工作效率,还增强了客户的满意度。
2025-06-19 14:44:10 79人关注
OpenAI 重磅推出 ChatGPT 企业版折扣,折扣幅度从10%到20%
OpenAI 宣布将为购买其 ChatGPT 企业版的客户提供新一轮的折扣。这次优惠针对的是那些捆绑购买额外产品的企业用户,折扣幅度从10% 到20% 不等,吸引了众多企业的关注。这一举措不仅能够帮助企业降低成本,也进一步拓展了 OpenAI 在企业市场的影响力。
ChatGPT企业版折扣 OpenAI企业优惠活动 企业AI工具成本优化 OpenAI市场拓展策略 企业AI解决方案采购
2025-06-18 16:40:20 37人关注
Akamai 利用 AI 技术和 Kubernetes 平台实现云成本节省 70%
在当前的数字时代,云计算的开销持续高企,企业在计算资源的使用效率上普遍存在浪费。根据最新统计,预计今年企业在不必要的云开销上将浪费高达445亿美元。Akamai Technologies 作为一家大型的网络安全和内容交付服务提供商,面临着复杂的多云基础设施以及严格的安全合规要求,因此需要寻找有效的解决方案来优化云成本。
2025-05-29 16:45:27 75人关注
ScaleOT框架亮相AAAI 2025:提升隐私保护50%,降算力成本90%
近日,在全球人工智能顶级学术会议AAAI2025期间,蚂蚁数科、浙江大学、利物浦大学和华东师范大学联合团队提出创新的跨域微调(offsite-tuning)框架——ScaleOT。该框架能在模型性能无损前提下,将隐私保护效果提升50%,与知识蒸馏技术相比,算力消耗显著降低90%,为百亿级参数模型的跨域微调提供高效轻量化方案,论文因创新性入选AAAI的oral论文(本届大会近13000篇投稿,口头报告比例仅4.6%)。
2025-03-17 08:10:29 89人关注
亚马逊 CEO:AI 成本因 DeepSeek 技术大幅降低
近日,亚马逊首席执行官安迪・贾西在与分析师的电话会议中谈到了人工智能(AI)技术的发展及其成本问题。他表示,随着新技术的不断涌现,特别是 DeepSeek 等模型的推出,人工智能推理的成本将会显著下降。这一变化将使得更多企业能够轻松将 AI 应用于其业务中,尤其是在推理和生成式 AI 的领域。
2025-03-06 12:45:24 108人关注
巴西初创公司Carecode推出AI智能体,力图降低医疗成本
随着人工智能在医疗领域的潜力日益受到关注,巴西初创公司 Carecode 也在这一趋势中崭露头角。Carecode 专注于利用人工智能智能体处理医疗预约前后的各种任务,旨在降低医疗费用并改善医疗效果。
2025-02-06 10:43:44 1197人关注
谷歌重磅发布Gemini 2.0全系列模型 三款模型性能、成本双双突破
谷歌扩展了其人工智能模型家族,推出了三款新版本的 Gemini2.0模型,分别为基础版 Gemini2.0Flash、经济版 Gemini2.0Flash-Lite 以及实验版 Gemini2.0Pro。这些新模型旨在满足不同的使用需求,并在性能和成本之间提供多样化的平衡。
Google Gemini 2.0模型 大模型性能突破 大模型成本优化 Google Gemini 2.0性能提升 Google Gemini 2.0成本降低
2025-02-05 10:26:19 138人关注
超贵!OpenAI o3 模型单次查询竟高达 1000 美元!
OpenAI 最近推出的 o3AI 模型被认为是其最强大的人工智能产品,但其运行成本却令人咋舌,单次任务费用超过1000美元。
2025-01-22 17:30:28 153人关注
OpenAI开放满血o1模型API:成本降低60% 新增高级视觉处理能力
在为期12个工作日的连续直播活动中,OpenAI在第9天面向开发者发布了o1模型的API,并宣布对实时API进行重大升级,支持WebRTC技术。
2025-01-14 00:42:14 84人关注
Zyphra推小语言模型Zamba2-2.7B: 速度提高一倍,内存成本降低27%
最近,Zyphra 公司发布了全新的 Zamba2-2.7B 语言模型,这一发布在小型语言模型的发展史上具有重要意义。新模型在性能和效率方面取得了显著提升,它的训练数据集达到了大约3万亿个标记,这使得它在性能上可以与 Zamba1-7B 及其他领先的7B 模型相媲美。
2025-01-10 10:17:43 106人关注
Anthropic API 推出提示缓存功能:显著降低AI交互成本与延迟
Anthropic API 近日推出了提示缓存功能,开发人员现在可以在API调用之间缓存常用的上下文信息。通过提示缓存,客户能够为Claude模型提供更多的背景知识和示例输出,同时显著降低长提示的成本,减少高达90%的费用,降低高达85%的延迟。
Anthropic API Prompt Caching API成本优化 API延迟优化 Anthropic API性能提升