- 上云资讯 -
2025-05-01 16:25:20 53人关注
阿里开源多模态模型Qwen2.5-Omni:显存大幅降低暴降 50%
在开源大模型的竞争中,阿里巴巴推出了其最新的多模态模型 Qwen2.5-Omni-3B。这款模型的显著特点是显存使用减少了50%,在同等处理能力下,更加适合普通消费者的 GPU 设备。这一创新标志着阿里在多模态人工智能领域的进一步突破。
2025-01-27 21:24:22 54人关注
阿里云发布全新数学推理模型Qwen2.5-Math-PRM,7B 版本超越 GPT-4o
今天,阿里云通义团队正式发布了全新的数学推理过程奖励模型 Qwen2.5-Math-PRM。该模型提供了72B 和7B 两种尺寸,性能表现均显著优于同类的开源过程奖励模型,尤其是在识别推理错误方面表现突出。
2025-01-02 22:38:12 430人关注
阿里通义千问开源Qwen2.5系列模型:Qwen2-VL-72B媲美GPT-4
通义千问团队宣布,继Qwen2发布三个月后,Qwen家族的最新成员——Qwen2.5系列语言模型正式开源。这标志着可能是历史上最大规模的开源发布之一,包括了通用语言模型Qwen2.5,以及专门针对编程和数学领域的Qwen2.5-Coder和Qwen2.5-Math模型。
2024-12-20 22:37:36 110人关注
通义千问开源Qwen2.5-Coder全系列 代码能力追平 GPT-4o
通义千问团队近日宣布开源其最新的Qwen2.5-Coder全系列,这一举措旨在推动Open Code LLMs的发展。Qwen2.5-Coder以其强大、多样和实用性受到关注。Qwen2.5-Coder-32B-Instruct模型在代码能力上达到了SOTA水平,与GPT-4o相当,展现出全面的能力,包括代码生成、代码修复和代码推理。它在多个代码生成基准测试中取得了最佳表现,并在Aider基准测试中达到73.7分,与GPT-4o表现相当。
通义千问2.5代码能力 通义千问2.5代码模型 Qwen-2.5-Coder代码能力 GPT-4代码能力对比 AI代码模型评测
2024-12-19 02:24:19 50人关注
阿里云发布逆天大模型Qwen2.5-Turbo 一口气读完十本小说,推理速度提升4.3倍!
阿里云重磅推出全新升级的Qwen2.5-Turbo大语言模型,其上下文长度突破至惊人的100万Token。这相当于什么概念?相当于10部《三体》,150小时的语音转录或3万行代码的容量!这回可真是“一口气读完十本小说”不是梦了!
阿里云通义千问2.5 Turbo模型 大模型推理速度优化 大模型阅读性能提升 通义千问2.5 Turbo技术解析 AI大模型性能优化
2024-12-18 15:43:20 53人关注
阿里云百炼上线通义千问百万长文本模型Qwen2.5-Turbo
阿里云百炼平台近日宣布上线了Qwen2.5-Turbo百万长文本模型,Qwen2.5-Turbo模型由通义千问团队开发,支持处理高达100万tokens的超长上下文,相当于100万个英文单词或150万个汉字。