- 上云资讯 -
2025-05-30 10:16:17 21人关注
通义新一代轻量化大语言模型DistilQwen2.5 发布 提升性能与效率
在大语言模型逐渐普及的今天,如何在资源受限的环境中实现高效部署已成为重要课题。为了解决这一挑战,基于 Qwen2.5的轻量化大模型系列 DistilQwen2.5正式发布。该模型采用了创新的双层蒸馏框架,通过优化数据和参数融合技术,不仅保留了模型的性能,同时显著降低了计算资源的消耗。
2025-05-01 16:25:20 53人关注
阿里开源多模态模型Qwen2.5-Omni:显存大幅降低暴降 50%
在开源大模型的竞争中,阿里巴巴推出了其最新的多模态模型 Qwen2.5-Omni-3B。这款模型的显著特点是显存使用减少了50%,在同等处理能力下,更加适合普通消费者的 GPU 设备。这一创新标志着阿里在多模态人工智能领域的进一步突破。
2025-01-27 21:24:22 54人关注
阿里云发布全新数学推理模型Qwen2.5-Math-PRM,7B 版本超越 GPT-4o
今天,阿里云通义团队正式发布了全新的数学推理过程奖励模型 Qwen2.5-Math-PRM。该模型提供了72B 和7B 两种尺寸,性能表现均显著优于同类的开源过程奖励模型,尤其是在识别推理错误方面表现突出。
2025-01-20 02:28:19 35人关注
Arcee Spark:以Qwen2 为基础的模型在多项任务上超越 GPT-3.5
近日,一款以Qwen2为基础的模型 Arcee Spark ,在180万个样本数据上进行了微调,具有128k token上下文。 Arcee Spark 的发布,引起了广泛的关注,尤其是在人工智能领域的从业者中,更是引发了一股热潮。
2025-01-16 04:13:25 67人关注
Arcee AI发布开源语言模型Arcee-Nova:基于Qwen2-72B 性能接近 GPT-4
最近,Arcee AI 正式推出了其最新的开源语言模型 ——Arcee-Nova。这一新模型基于 Qwen2-72B-Instruct,迅速在开源领域中崭露头角,成为表现最优异的模型之一。经过评估,Arcee-Nova 的表现几乎达到了2023年5月的 GPT-4水准,这不仅标志着 Arcee AI 的一个重要里程碑,也为整个 AI 社区带来了新的希望。
2025-01-11 10:11:16 202人关注
阿里巴巴发布新语音模型 Qwen2-Audio,实力超越 OpenAI Whisper
近日,阿里巴巴在其 Qwen-Audio 的基础上,推出了全新的开源语音模型 Qwen2-Audio。这款模型不仅在语音识别、翻译和音频分析方面表现出色,更是在功能和性能上实现了显著提升。Qwen2-Audio 提供了基础版和指令微调版,用户可以通过语音对音频模型提问,并识别和分析内容。
2025-01-09 10:19:13 110人关注
通义千问数学模型Qwen2 Math Demo放出,72B版吊打GPT-4
阿里巴巴的"通义千问"团队又搞了个大新闻!他们刚刚放出了Qwen2Math Demo,这个数学模型简直是个小怪兽,连GPT-4都被它踩在脚下。
2025-01-07 06:35:21 224人关注
阿里通义千问团队推出Qwen2-VL模型 支持实时分析动态视频
阿里巴巴达摩院的通义千问团队在2024年8月30日宣布了其最新成果——Qwen2-VL模型的重大更新。Qwen2-VL模型在图像理解、视频处理和多语言支持方面均实现了显著提升,为关键性能指标设定了新的基准。
2025-01-07 04:33:26 171人关注
阿里重磅开源超强AI模型Qwen2-VL:能理解超 20 分钟视频
阿里巴巴的云计算部门刚刚发布了一款全新的 AI 模型 ——Qwen2-VL。这款模型的强大之处在于它能够理解视觉内容,包括图片和视频,甚至可以实时分析长达20分钟的视频,可以说相当强悍。
2025-01-06 14:19:15 412人关注
通义千问开源视觉语言模型Qwen2-VL 2B、7B尺寸API可直接调用
9月2日,通义千问宣布开源其第二代视觉语言模型Qwen2-VL,并在阿里云百炼平台上推出2B、7B两个尺寸及其量化版本模型的API,供用户直接调用。
Qwen2-VL-2B Qwen2-VL-7B Qwen2-VL API 大模型API Qwen2-VL 应用场景 Qwen2-VL 技术解析
2025-01-02 22:38:12 429人关注
阿里通义千问开源Qwen2.5系列模型:Qwen2-VL-72B媲美GPT-4
通义千问团队宣布,继Qwen2发布三个月后,Qwen家族的最新成员——Qwen2.5系列语言模型正式开源。这标志着可能是历史上最大规模的开源发布之一,包括了通用语言模型Qwen2.5,以及专门针对编程和数学领域的Qwen2.5-Coder和Qwen2.5-Math模型。
2024-12-20 22:37:36 110人关注
通义千问开源Qwen2.5-Coder全系列 代码能力追平 GPT-4o
通义千问团队近日宣布开源其最新的Qwen2.5-Coder全系列,这一举措旨在推动Open Code LLMs的发展。Qwen2.5-Coder以其强大、多样和实用性受到关注。Qwen2.5-Coder-32B-Instruct模型在代码能力上达到了SOTA水平,与GPT-4o相当,展现出全面的能力,包括代码生成、代码修复和代码推理。它在多个代码生成基准测试中取得了最佳表现,并在Aider基准测试中达到73.7分,与GPT-4o表现相当。
通义千问2.5代码能力 通义千问2.5代码模型 Qwen-2.5-Coder代码能力 GPT-4代码能力对比 AI代码模型评测
2024-12-19 17:24:24 53人关注
一句话帮你生成应用!阿里通义上线代码模式:基于Qwen2.5-Coder开发
11月15日,阿里通义实验室推出了代码模式,该功能使得用户能够通过简单的日常语言指令生成各种应用,包括小游戏、数据图表、网站和简历等。用户只需访问通义网页版(tongyi.ai),点击输入框中的“代码模式”即可开始体验这一全新交互方式。
2024-12-19 02:24:19 50人关注
阿里云发布逆天大模型Qwen2.5-Turbo 一口气读完十本小说,推理速度提升4.3倍!
阿里云重磅推出全新升级的Qwen2.5-Turbo大语言模型,其上下文长度突破至惊人的100万Token。这相当于什么概念?相当于10部《三体》,150小时的语音转录或3万行代码的容量!这回可真是“一口气读完十本小说”不是梦了!
阿里云通义千问2.5 Turbo模型 大模型推理速度优化 大模型阅读性能提升 通义千问2.5 Turbo技术解析 AI大模型性能优化