- 上云资讯 -
2025-07-31 17:45:27 37人关注
阿里WebShaper发布!GAIA碾压Claude 3.5 Sonnet、GPT-4o
阿里通义实验室(Tongyi Lab)近日重磅推出WebAgent系列的第四款开源工具——WebShaper,这一突破性框架以其创新的“形式化驱动”信息检索范式引发行业热议。据AIbase从社交媒体及相关渠道获悉,WebShaper不仅在GAIA基准测试中取得60.19的高分,超越了Claude3.5Sonnet和GPT-4o,还通过全新的数据生成方法显著提升了AI在复杂任务中的信息检索与推理能力。
阿里通义实验室 WebAgent系列开源工具 WebShaper框架 形式化驱动信息检索 GAIA基准测试高分 AI复杂任务推理能力
2025-07-25 12:33:42 67人关注
阿里通义千问AI编程大模型Qwen3-Coder登顶榜首
在7月24日,全球最大的 AI 开源社区 Hugging Face 发布了最新的大模型排行榜,令人瞩目的阿里巴巴 Qwen3-Coder 成功登顶,成为全球热度最高的开源 AI 编程模型,甚至超越了备受瞩目的 GPT-4.1和 Claude4。
Hugging Face 大模型排行榜 阿里巴巴 Qwen3-Coder 开源 AI 编程模型 GPT-4.1 对比 Qwen3-Coder Claude4 与 Qwen3-Coder 性能比较 全球 AI 编程模型热度排名
2025-07-22 13:33:19 87人关注
阿里通义千问重磅发布 Qwen3 模型,AI 技术再升级!
阿里通义千问近期宣布了其旗舰产品 Qwen3模型的最新更新,推出了一个名为 Qwen3-235B-A22B-Instruct-2507-FP8的新版本。这一新版本的亮点在于它采用了非思考模式(Non-thinking),并且大幅提升了长文本处理的能力,扩展到256K 的文本长度。这一升级无疑将大幅提升模型的应用潜力,特别是在需要处理大量信息的场景中。
阿里通义千问 Qwen3模型更新 Qwen3-235B-A22B-Instruct-2507-FP8 非思考模式 长文本处理能力 256K文本长度
2025-07-09 16:45:44 115人关注
阿里开源 WebSailor,具备强大的推理和检索能力
阿里通义于近日正式开源了其网络智能体 WebSailor,该智能体具备强大的推理和检索能力。
2025-05-20 10:41:33 99人关注
阿里通义千问推出推理模型QwQ-Max预览版 可在qwen.ai域名体验
2月25日,阿里巴巴宣布推出基于Qwen2.5-Max的推理模型QwQ-Max-Preview,并计划全面开源其最新推理模型QwQ-Max和Qwen2.5-Max。
2025-05-12 16:39:19 80人关注
阿里通义千问成为日本AI发展的新基石
近日,日本经济新闻(NIKKEI)发表了一篇引人注目的报道,指出阿里巴巴的通义千问大模型正迅速成为日本人工智能开发的重要基础。随着全球 AI 技术的飞速发展,通义千问的表现已在国际舞台上崭露头角,尤其是在日经新闻对各大 AI 模型进行的综合评测中,通义千问 Qwen2.5-Max 一举夺得第六名,超越了许多国内外知名模型,包括 DeepSeek-V3和 OpenAI 的 o3-mini 等。
2025-04-19 10:28:32 237人关注
AI日报:阿里通义万相首尾帧生视频模型;豆包开源Seed智能体模型UI-TARS-1.5;OpenAI首发“智能体实践指南”
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
2025-04-12 16:29:21 105人关注
斯坦福权威报告盖章!阿里通义千问贡献排名全球第三!用算力优势重塑全球竞争格局!
近日,斯坦福大学人工智能研究所发布了《2025年人工智能指数报告》,为全球人工智能领域的发展提供了新的视角。报告指出,阿里巴巴在全球重要大模型贡献中位居第三,成为中国科技公司的领军代表。
2025-03-27 18:30:34 95人关注
阿里通义实验室开源音乐生成技术InspireMusic
近日,通义实验室正式开源了其创新性的音乐生成技术——InspireMusic。该技术旨在打造一个集音乐、歌曲及音频生成能力于一体的开源AIGC工具包,为研究者、开发者及音乐爱好者提供一个全面的创作平台。
2025-03-25 10:45:30 130人关注
广州算力中心接入阿里通义千问大模型QwQ-32B
广州人工智能公共算力中心宣布成功适配并上线阿里通义千问的最新开源推理模型 ——QwQ-32B。这一模型在多个领域的权威评测中表现出色,尤其在数学、编程和通用能力等方面,其性能与满血版671B 的 DeepSeek-R1模型相当,明显超越了 o1-mini 及同尺寸的 R1蒸馏模型。