LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-05-19 18:15:29 67人关注

Claude 3.7 Sonnet登陆Perplexity Pro,带来性能新提升

2025年2月24日,Perplexity 平台宣布支持新的 AI 模型 Claude3.7Sonnet (Anthropic 发布 Claude3.7Sonnet)。官方 X 帖子称,该模型已进行内部测试一段时间,观察到代理工作流程和代码生成的显著改进。

Claude 3.7 Claude 3.7 Sonnet Perplexity Pro 性能提升 大模型性能优化

2025-04-07 10:31:39 89人关注

Meta被指AI模型"双标":评测版与公开版Maverick表现大相径庭

Meta周六发布了其新旗舰AI模型Maverick,该模型在LM Arena评测中排名第二。LM Arena是一项依靠人类评分者比较不同模型输出并选择偏好的测试平台。然而,多位AI研究人员很快发现,Meta部署到LM Arena的Maverick版本似乎与开发人员广泛使用的版本存在显著差异。

Meta AI模型 Maverick性能差异 AI模型性能对比 Meta AI技术解析 大模型性能优化

2025-03-19 16:14:13 86人关注

大模型长文推理迎来“核弹级”提速!清华APBB框架狂飙10倍,Flash Attention直接被秒

还在为大模型处理长文本“龟速”而抓狂?别急!清华大学祭出“王炸”技术——APB 序列并行推理框架,直接给大模型装上“涡轮增压”引擎!实测显示,这项黑科技在处理超长文本时,速度竟比肩 Flash Attention 快10倍!没错,你没听错,是10倍!

大模型推理加速 清华APBB技术 大模型性能优化 推理速度提升方案 大模型技术突破

2024-12-19 02:24:19 100人关注

阿里云发布逆天大模型Qwen2.5-Turbo 一口气读完十本小说,推理速度提升4.3倍!

阿里云重磅推出全新升级的Qwen2.5-Turbo大语言模型,其上下文长度突破至惊人的100万Token。这相当于什么概念?相当于10部《三体》,150小时的语音转录或3万行代码的容量!这回可真是“一口气读完十本小说”不是梦了!

阿里云通义千问2.5 Turbo模型 大模型推理速度优化 大模型阅读性能提升 通义千问2.5 Turbo技术解析 AI大模型性能优化

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10