- 上云资讯 -
2025-07-30 10:18:28 70人关注
通义千问开源Qwen3-30B-A3B-Instruct-2507非思考模式模型
7月29日,Qwen3-30B-A3B模型推出了新版本Qwen3-30B-A3B-Instruct-2507。这一新版本在多个关键领域实现了显著提升,标志着该模型在非思考模式(non-thinking mode)下仅激活3B参数,就能达到与Gemini2.5-Flash(non-thinking)、GPT-4o等顶尖闭源模型相媲美的性能。
2025-07-26 17:39:27 64人关注
通义灵码宣布上线Qwen3-Coder 免费使用不限量
通义灵码宣布上线全新的Qwen3-Coder模型,并且这一强大功能将免费向用户开放,使用量不受限制。
2025-07-25 12:33:42 68人关注
阿里通义千问AI编程大模型Qwen3-Coder登顶榜首
在7月24日,全球最大的 AI 开源社区 Hugging Face 发布了最新的大模型排行榜,令人瞩目的阿里巴巴 Qwen3-Coder 成功登顶,成为全球热度最高的开源 AI 编程模型,甚至超越了备受瞩目的 GPT-4.1和 Claude4。
Hugging Face 大模型排行榜 阿里巴巴 Qwen3-Coder 开源 AI 编程模型 GPT-4.1 对比 Qwen3-Coder Claude4 与 Qwen3-Coder 性能比较 全球 AI 编程模型热度排名
2025-07-25 10:11:35 87人关注
通义千问Qwen推出机器翻译模型Qwen-MT 基于Qwen 3打造
Qwen-MT机器翻译模型正式发布,Qwen-MT基于强大的Qwen3模型,经过超大规模多语言和翻译数据的训练,结合强化学习技术,显著提升了翻译结果的准确性和语言流畅度。开发者可以通过Qwen API(qwen-mt-turbo)直接体验其快速且准确的翻译能力。
2025-07-24 10:38:27 291人关注
Qwen3-Coder上线阿里云百炼 价格比Claude 4便宜3倍
7月23日,阿里云正式推出了最新的 AI 编程大模型 ——Qwen3-Coder API。目前,Qwen3-Coder API已在阿里云百炼上线。这一全新的编程助手不仅功能强大,而且在价格上也极具竞争力,令人瞩目。
阿里云AI编程大模型 Qwen3-Coder API功能 Qwen3-Coder API价格优势 阿里云百炼AI编程助手 AI编程大模型应用场景
2025-07-22 13:33:19 87人关注
阿里通义千问重磅发布 Qwen3 模型,AI 技术再升级!
阿里通义千问近期宣布了其旗舰产品 Qwen3模型的最新更新,推出了一个名为 Qwen3-235B-A22B-Instruct-2507-FP8的新版本。这一新版本的亮点在于它采用了非思考模式(Non-thinking),并且大幅提升了长文本处理的能力,扩展到256K 的文本长度。这一升级无疑将大幅提升模型的应用潜力,特别是在需要处理大量信息的场景中。
阿里通义千问 Qwen3模型更新 Qwen3-235B-A22B-Instruct-2507-FP8 非思考模式 长文本处理能力 256K文本长度
2025-07-03 14:39:14 192人关注
DeepSWE 开源 AI Agent系统强势登顶,基于 Qwen3-32B
在人工智能领域,又一重磅消息传来。今天凌晨,知名大模型训练平台 Together.ai 与 Agentica 联合推出了开源 AI Agent框架 DeepSWE。这一创新系统是基于阿里最新开源的 Qwen3-32B 模型,完全通过强化学习进行训练。
Together.ai Agentica 开源AI Agent框架 DeepSWE Qwen3-32B模型 强化学习训练
2025-06-23 15:31:40 85人关注
Hey,Siri!你知道 Qwen3 全系适配 MLX 了吗?
通义千问(Qwen)3系列模型已全面适配苹果MLX框架,用户可通过MLX在苹果芯片设备上高效运行Qwen3系列大语言模型。这一适配使开发者能在MacBook等苹果设备本地部署Qwen3模型,包括Qwen1.8B、Qwen7B等不同规模版本,显著提升在苹果生态下的AI应用开发效率。MLX作为苹果专为机器学习优化的框架,其与Qwen3的兼容实现了在Apple Silicon上的原生加速,为开发者提供了更便捷的大模型本地化部署方案。该进展进一步拓展了Qwen系列模型的应用场景,使其能够更好地服务于苹果设备用户。
通义千问3系列 MLX框架适配 Qwen3苹果本地部署 Apple Silicon加速 大模型本地化部署方案 Qwen系列应用场景拓展
2025-06-23 15:17:45 95人关注
Qwen3-Embedding,这周很trending!
Qwen3-Embedding 近期成为热门话题,引发广泛关注。这一技术趋势的兴起可能与它在自然语言处理领域的突破性应用有关,或是其性能表现引发了业界的讨论。虽然具体技术细节和性能数据未在提供的内容中明确说明,但"trending"一词表明该模型或方法在当前AI社区具有较高的讨论度和影响力。其热度可能源于相比前代模型的显著改进,或是在特定任务(如文本嵌入、语义理解等)上展现出的优越性。这一现象反映了AI领域对高效嵌入技术的持续需求,以及开源社区对前沿模型的快速响应。
2025-06-20 16:40:14 58人关注
接入通义千问3后,B站618期间商单成交效率提升5倍+
B站近期接入通义千问Qwen3、Qwen-VL等模型推出数据洞察智能体InsightAgent,显著提升了其商业平台“花火”和“必达”的运营效率。618期间,“花火”平台商单成交效率提升5倍以上,“必达”平台数据洞察效率提升3倍以上。花火平台新增的AI选人功能可基于品牌需求和UP主数据自动匹配,并推荐创意方向,解决了以往人工筛选效率低、主观性强的问题。必达平台则利用InsightAgent实现智能报告生成,包括人群推荐、行业趋势分析等。B站相关负责人表示,通义系列模型尤其是Qwen3的混合思考模式能高效处理简单和复杂问题,在节省算力的同时满足品牌需求。
B站通义千问Qwen3 花火平台AI选人功能 必达平台智能报告生成 通义千问Qwen-VL模型 InsightAgent数据洞察智能体 618商单成交效率提升
2025-06-20 16:18:41 58人关注
B站接入通义千问Qwen 3等模型 推出数据洞察智能体InsightAgent
近日,B站宣布接入通义千问Qwen3、Qwen-VL等模型,并基于此打造了数据洞察智能体InsightAgent,这一举措为其商业平台“花火”和“必达”带来了显著的效率提升。
B站AI模型接入 通义千问Qwen3应用 Qwen-VL模型 数据洞察智能体InsightAgent B站商业平台效率提升 花火必达AI赋能
2025-05-04 16:33:25 329人关注
阿里Qwen3-235B-A22B模型正式登陆HuggingChat
由阿里巴巴云开发的 Qwen3-235B-A22B 模型正式在 HuggingChat 平台上线。这一开源大型语言模型以其强大的推理能力、灵活的模式切换和高效的性能表现,迅速成为业界关注的焦点。AIbase 通过整理 Twitter 上的最新信息,为您深入解析 Qwen3-235B-A22B 的技术亮点及其对开源 AI 生态的影响。
2025-05-03 10:19:39 833人关注
Unsloth发布Qwen3动态量化2.0版本,优化本地运行体验
Unsloth宣布推出Qwen3的动态量化2.0版本(Dynamic2.0Quants),为显存受限的用户提供了高效的本地运行解决方案。据AIbase了解,新版本通过改进的量化技术,在保持高准确度的同时显著降低显存需求,引发社交平台广泛关注。Unsloth还同步发布了详细的本地运行教程,强调温度(Temperature)参数设置的重要性,以避免推理循环问题。相关细节已通过Hugging Face(huggingface.co/unsloth)与Unsloth官网(unsloth.ai)公开。
2025-04-29 10:39:43 794人关注
Qwen3正式发布,优化编码与代理能力,强化MCP支持引领AI新潮流
阿里云Qwen团队宣布Qwen3系列模型正式发布,以卓越的编码能力、增强的代理功能和对Model Context Protocol(MCP)的深度支持,掀起AI社区热潮。据AIbase了解,Qwen3涵盖从0.6B到235B-A22B的多种模型规模,优化了数学推理、代码生成和多模态任务,性能直追GPT-4o与Gemini-2.5-Pro。社交平台上的讨论显示,Qwen3的MCP集成与开源策略备受期待,相关细节已通过Hugging Face与Qwen官网公开。
2025-04-29 10:35:22 143人关注
阿里发布开源Qwen3,成本大幅降低仅需DeepSeek-R1的三分之一
阿里巴巴正式推出新一代通义千问模型 Qwen3(千问3),并宣布其开源。阿里云表示,千问3是国内首个 “混合推理模型”,同时集成了 “快思考” 与 “慢思考” 的能力。相比于 DeepSeek-R1,千问3的参数量仅为其三分之一,而部署成本大幅降低,使用仅需四张 H20显卡即可实现满血版的部署。
2025-04-29 10:25:43 259人关注
通义千问Qwen3发布:推理能力显著增强 支持两种思考模式
通义千问团队宣布推出Qwen3,这是Qwen系列大型语言模型的最新成员。Qwen3系列模型在代码、数学和通用能力等基准测试中表现出色,与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型相比,展现了极具竞争力的结果。其中,小型MoE模型Qwen3-30B-A3B的激活参数数量仅为QwQ-32B的10%,但表现更胜一筹,而像Qwen3-4B这样的小模型也能匹敌Qwen2.5-72B-Instruct的性能。