- 上云资讯 -
2025-05-10 10:14:36 89人关注
Gemini API推出隐式缓存功能,开发者成本降低75%
Gemini API推出隐式缓存(Implicit Caching)功能,为开发者带来显著的成本优化体验。新功能无需开发者手动创建缓存,当请求与先前请求共享共同前缀时,系统将自动触发缓存命中,提供高达75%的Token折扣。此更新已覆盖Gemini2.5Pro和2.5Flash模型,进一步提升了AI开发的成本效益。官方详情可参考:https://developers.googleblog.com
2025-01-10 08:39:25 120人关注
Claude推出"提示缓存"功能 允许开发人员在API上缓存常用上下文
8月14日,Anthropic公司宣布为其Claude系列大型语言模型推出一项名为"提示缓存"的新功能,声称能大幅降低企业使用AI的成本,同时提升性能。但这项功能究竟是否能如公司所言那般神奇,还有待市场检验。
Claude Prompt Caching API API上下文优化 Claude提示缓存技术 大模型API性能优化 Prompt缓存机制