上云资讯 - 来上云吧，企业上云一站式服务

2025-07-21 11:26:40 280人关注

阿里巴巴Qwen2.5数学能力遭质疑:新研究揭示模型或依赖记忆而非推理

据国外媒体报道，一项最新研究对阿里巴巴Qwen2.5模型的高数学分数提出了质疑，指出其看似卓越的数学推理能力，可能主要来源于对训练数据的记忆，而非真正的推理。研究人员通过一系列严谨的测试发现，数据污染可能是导致Qwen2.5在某些基准测试中表现优异的关键因素。

阿里巴巴Qwen2.5模型 AI模型数学能力评估数据污染对AI模型的影响 AI模型记忆与推理能力大模型基准测试问题

2025-06-23 10:35:29 373人关注

魔搭社区模型速递（6.14-6.21）

魔搭社区在6月14日至6月21日期间取得了显著进展，共发布了1154个模型、185个数据集和63个创新应用。社区重点展示了多个AI模型的应用实例，包括使用`AutoModelForCausalLM`和`AutoTokenizer`进行文本生成、`Qwen2_5_VLForConditionalGeneration`进行多模态处理等。技术实现方面详细介绍了模型加载、输入处理（如文本模板应用、视觉信息处理）和生成输出（如ID解码）的完整流程。社区还推荐了Nanonets-ocr等具体应用案例，并提供了模型调用示例代码（如`pip install`安装、`generate`方法参数设置）。最后邀请用户关注公众号获取更多技术资讯。

魔搭社区AI模型发布魔搭社区数据集更新魔搭社区创新应用案例 AutoModelForCausalLM文本生成 Qwen2_5_VL多模态处理 Nanonets-ocr应用案例

2025-05-30 10:16:17 237人关注

通义新一代轻量化大语言模型DistilQwen2.5 发布提升性能与效率

在大语言模型逐渐普及的今天，如何在资源受限的环境中实现高效部署已成为重要课题。为了解决这一挑战，基于 Qwen2.5的轻量化大模型系列 DistilQwen2.5正式发布。该模型采用了创新的双层蒸馏框架，通过优化数据和参数融合技术，不仅保留了模型的性能，同时显著降低了计算资源的消耗。

轻量级语言模型 DistilQwen2-5模型发布语言模型优化模型轻量化技术 AI模型压缩方法

2025-05-09 08:19:30 268人关注

西北工业大学开源语音理解模型OSUM，结合Whisper和Qwen2，支持8种语音理解任务

在人工智能领域，语言模型的快速发展引发了语音理解语言模型（SULMs）的广泛关注。近日，西北工业大学 ASLP 实验室发布了开放语音理解模型 OSUM，旨在探索在学术资源有限的情况下，如何有效训练和利用语音理解模型，以推动学术界的研究与创新。

NWPU OSUM Whisper Qwen2-8 语音任务语音处理技术

2025-05-01 16:25:20 506人关注

阿里开源多模态模型Qwen2.5-Omni：显存大幅降低暴降 50%

在开源大模型的竞争中，阿里巴巴推出了其最新的多模态模型 Qwen2.5-Omni-3B。这款模型的显著特点是显存使用减少了50%，在同等处理能力下，更加适合普通消费者的 GPU 设备。这一创新标志着阿里在多模态人工智能领域的进一步突破。

阿里巴巴通义千问2.5 通义千问2.5多模态模型阿里大模型技术多模态AI模型 Qwen2.5 Omni技术解析

2025-01-29 11:36:15 380人关注

阿里云通义开源Qwen2.5-VL，视觉AI超越Claude 3.5

阿里云通义千问开源了全新的视觉模型Qwen2.5-VL，并推出了3B、7B和72B三个尺寸版本。

阿里云通义千问25 Vision AI 通义千问25 VL 阿里云AI大模型视觉AI技术

2025-01-27 21:24:22 278人关注

阿里云发布全新数学推理模型Qwen2.5-Math-PRM，7B 版本超越 GPT-4o

今天，阿里云通义团队正式发布了全新的数学推理过程奖励模型 Qwen2.5-Math-PRM。该模型提供了72B 和7B 两种尺寸，性能表现均显著优于同类的开源过程奖励模型，尤其是在识别推理错误方面表现突出。

阿里云通义千问2.5 数学大模型PRM-7B GPT4o对比大模型技术解析通义千问2.5数学能力

2025-01-27 16:24:17 535人关注

阿里云 Qwen2.5-1M 开源发布:100万上下文长度模型登场

继 DeepSeek R1之后，阿里云通义千问团队刚刚宣布推出其最新的开源模型 Qwen2.5-1M，再次引发业界关注。

阿里云通义千问 Qwen2开源模型 1M上下文大模型开源大模型技术通义千问2.5版本阿里云AI大模型

2025-01-20 02:28:19 224人关注

Arcee Spark：以Qwen2 为基础的模型在多项任务上超越 GPT-3.5

近日，一款以Qwen2为基础的模型 Arcee Spark ，在180万个样本数据上进行了微调，具有128k token上下文。 Arcee Spark 的发布，引起了广泛的关注，尤其是在人工智能领域的从业者中，更是引发了一股热潮。

Arcee Spark Qwen2 GPT-3.5 大模型性能对比 AI模型评测

2025-01-16 23:16:43 626人关注

Qwen2-Audio：千问系列的音频多模态模型无需文字即可语音交互

阿里云最新发布了一名为 Qwen-Audio 的大规模音频语言型，该模型可接受多种音频信号输入，够进行音频分析或直接回答语音指令极大地提升了语音交互体验。

Qwen2音频模型多模态语音交互大模型语音技术 AI语音交互系统 Qwen2应用场景

2025-01-16 04:13:25 364人关注

Arcee AI发布开源语言模型Arcee-Nova：基于Qwen2-72B 性能接近 GPT-4

最近，Arcee AI 正式推出了其最新的开源语言模型 ——Arcee-Nova。这一新模型基于 Qwen2-72B-Instruct，迅速在开源领域中崭露头角，成为表现最优异的模型之一。经过评估，Arcee-Nova 的表现几乎达到了2023年5月的 GPT-4水准，这不仅标志着 Arcee AI 的一个重要里程碑，也为整个 AI 社区带来了新的希望。

Arcee AI 开源语言模型 Arcee Nova Qwen2 72B GPT4性能对比

2025-01-11 13:28:40 209人关注

阿里开源最新数学模型Qwen2-Math 数学能力秒杀GPT-4o

近日，阿里云重磅推出了Qwen2-Math系列大型语言模型，这一专注于数学领域的AI新秀一经亮相就引发了业界的广泛关注。

阿里通义千问2 数学大模型 GPT4性能对比通义千问2技术优势 AI大模型评测

2025-01-11 10:11:16 547人关注

阿里巴巴发布新语音模型 Qwen2-Audio，实力超越 OpenAI Whisper

近日，阿里巴巴在其 Qwen-Audio 的基础上，推出了全新的开源语音模型 Qwen2-Audio。这款模型不仅在语音识别、翻译和音频分析方面表现出色，更是在功能和性能上实现了显著提升。Qwen2-Audio 提供了基础版和指令微调版，用户可以通过语音对音频模型提问，并识别和分析内容。

阿里巴巴语音模型 Qwen2音频模型阿里巴巴AI语音技术 Qwen2音频技术阿里巴巴新语音模型发布

2025-01-09 10:19:13 318人关注

通义千问数学模型Qwen2 Math Demo放出，72B版吊打GPT-4

阿里巴巴的"通义千问"团队又搞了个大新闻!他们刚刚放出了Qwen2Math Demo，这个数学模型简直是个小怪兽，连GPT-4都被它踩在脚下。

Qwen2数学能力 Qwen2 72B模型 GPT4对比测试大模型数学评测 Qwen2与GPT4性能对比

2025-01-07 06:35:21 1314人关注

阿里通义千问团队推出Qwen2-VL模型支持实时分析动态视频

阿里巴巴达摩院的通义千问团队在2024年8月30日宣布了其最新成果——Qwen2-VL模型的重大更新。Qwen2-VL模型在图像理解、视频处理和多语言支持方面均实现了显著提升，为关键性能指标设定了新的基准。

阿里通义千问2.0 通义千问2.0视频分析动态视频分析技术 Qwen2-VL模型 AI视频处理技术

2025-01-07 04:33:26 559人关注

阿里重磅开源超强AI模型Qwen2-VL：能理解超 20 分钟视频

阿里巴巴的云计算部门刚刚发布了一款全新的 AI 模型 ——Qwen2-VL。这款模型的强大之处在于它能够理解视觉内容，包括图片和视频，甚至可以实时分析长达20分钟的视频，可以说相当强悍。

阿里通义千问2.0视觉语言模型通义千问VL模型 Qwen2-VL技术解析阿里巴巴AI大模型视觉语言模型应用场景

2025-01-06 14:19:15 1061人关注

通义千问开源视觉语言模型Qwen2-VL 2B、7B尺寸API可直接调用

9月2日，通义千问宣布开源其第二代视觉语言模型Qwen2-VL，并在阿里云百炼平台上推出2B、7B两个尺寸及其量化版本模型的API，供用户直接调用。

Qwen2-VL-2B Qwen2-VL-7B Qwen2-VL API 大模型API Qwen2-VL 应用场景 Qwen2-VL 技术解析

2025-01-02 22:38:12 1012人关注

阿里通义千问开源Qwen2.5系列模型：Qwen2-VL-72B媲美GPT-4

通义千问团队宣布，继Qwen2发布三个月后，Qwen家族的最新成员——Qwen2.5系列语言模型正式开源。这标志着可能是历史上最大规模的开源发布之一，包括了通用语言模型Qwen2.5，以及专门针对编程和数学领域的Qwen2.5-Coder和Qwen2.5-Math模型。

阿里通义千问2.5 通义千问2.5 通义千问VL 72B 大模型技术 AI大模型

2024-12-20 22:37:36 341人关注

通义千问开源Qwen2.5-Coder全系列代码能力追平 GPT-4o

通义千问团队近日宣布开源其最新的Qwen2.5-Coder全系列，这一举措旨在推动Open Code LLMs的发展。Qwen2.5-Coder以其强大、多样和实用性受到关注。Qwen2.5-Coder-32B-Instruct模型在代码能力上达到了SOTA水平，与GPT-4o相当，展现出全面的能力，包括代码生成、代码修复和代码推理。它在多个代码生成基准测试中取得了最佳表现，并在Aider基准测试中达到73.7分，与GPT-4o表现相当。

通义千问2.5代码能力通义千问2.5代码模型 Qwen-2.5-Coder代码能力 GPT-4代码能力对比 AI代码模型评测

2024-12-20 14:37:37 263人关注

最强开源代码模型 Qwen2.5-Coder 炸裂来袭！Cursor、Artifacts 绝佳新拍档！

在软件开发领域，对智能、强大且专用的代码语言模型有着持续的需求。虽然现有模型在代码生成、补全和推理方面取得了显著进展，但仍存在一些问题。

qwen2-5 开源模型 AI大模型代码生成模型开源AI技术

- 上云资讯 -

阿里巴巴Qwen2.5数学能力遭质疑:新研究揭示模型或依赖记忆而非推理

魔搭社区模型速递（6.14-6.21）

通义新一代轻量化大语言模型DistilQwen2.5 发布提升性能与效率

西北工业大学开源语音理解模型OSUM，结合Whisper和Qwen2，支持8种语音理解任务

阿里开源多模态模型Qwen2.5-Omni：显存大幅降低暴降 50%

阿里云通义开源Qwen2.5-VL，视觉AI超越Claude 3.5

阿里云发布全新数学推理模型Qwen2.5-Math-PRM，7B 版本超越 GPT-4o

阿里云 Qwen2.5-1M 开源发布:100万上下文长度模型登场

Arcee Spark：以Qwen2 为基础的模型在多项任务上超越 GPT-3.5

Qwen2-Audio：千问系列的音频多模态模型无需文字即可语音交互

Arcee AI发布开源语言模型Arcee-Nova：基于Qwen2-72B 性能接近 GPT-4

阿里开源最新数学模型Qwen2-Math 数学能力秒杀GPT-4o

阿里巴巴发布新语音模型 Qwen2-Audio，实力超越 OpenAI Whisper

通义千问数学模型Qwen2 Math Demo放出，72B版吊打GPT-4

阿里通义千问团队推出Qwen2-VL模型支持实时分析动态视频

阿里重磅开源超强AI模型Qwen2-VL：能理解超 20 分钟视频

通义千问开源视觉语言模型Qwen2-VL 2B、7B尺寸API可直接调用

阿里通义千问开源Qwen2.5系列模型：Qwen2-VL-72B媲美GPT-4

通义千问开源Qwen2.5-Coder全系列代码能力追平 GPT-4o

最强开源代码模型 Qwen2.5-Coder 炸裂来袭！Cursor、Artifacts 绝佳新拍档！

推荐阅读

上云服务

- 上云资讯 -

阿里巴巴Qwen2.5数学能力遭质疑:新研究揭示模型或依赖记忆而非推理

魔搭社区模型速递（6.14-6.21）

通义新一代轻量化大语言模型DistilQwen2.5 发布 提升性能与效率

西北工业大学开源语音理解模型OSUM，结合Whisper和Qwen2，支持8种语音理解任务

阿里开源多模态模型Qwen2.5-Omni：显存大幅降低暴降 50%

阿里云通义开源Qwen2.5-VL，视觉AI超越Claude 3.5

阿里云发布全新数学推理模型Qwen2.5-Math-PRM，7B 版本超越 GPT-4o

阿里云 Qwen2.5-1M 开源发布:100万上下文长度模型登场

Arcee Spark：以Qwen2 为基础的模型在多项任务上超越 GPT-3.5

Qwen2-Audio：千问系列的音频多模态模型 无需文字即可语音交互

Arcee AI发布开源语言模型Arcee-Nova：基于Qwen2-72B 性能接近 GPT-4

阿里开源最新数学模型Qwen2-Math 数学能力秒杀GPT-4o

阿里巴巴发布新语音模型 Qwen2-Audio，实力超越 OpenAI Whisper

通义千问数学模型Qwen2 Math Demo放出，72B版吊打GPT-4

阿里通义千问团队推出Qwen2-VL模型 支持实时分析动态视频

阿里重磅开源超强AI模型Qwen2-VL：能理解超 20 分钟视频

通义千问开源视觉语言模型Qwen2-VL 2B、7B尺寸API可直接调用

阿里通义千问开源Qwen2.5系列模型：Qwen2-VL-72B媲美GPT-4

通义千问开源Qwen2.5-Coder全系列 代码能力追平 GPT-4o

最强开源代码模型 Qwen2.5-Coder 炸裂来袭！Cursor、Artifacts 绝佳新拍档！

推荐阅读

上云服务

通义新一代轻量化大语言模型DistilQwen2.5 发布提升性能与效率

Qwen2-Audio：千问系列的音频多模态模型无需文字即可语音交互

阿里通义千问团队推出Qwen2-VL模型支持实时分析动态视频

通义千问开源Qwen2.5-Coder全系列代码能力追平 GPT-4o