- 上云资讯 -
2025-09-02 17:23:23 58人关注
Cherry Studio 与硅基流动深度合作,免费提供 Qwen38B 模型
近日,Cherry Studio 宣布与硅基流动(Silicon-Based Flow)展开深度合作,为用户免费提供广受欢迎的 Qwen38B 模型。这一合作进一步丰富了 Cherry Studio 的多模型支持能力,为用户带来更便捷、高效的 AI 交互体验。
Qwen38B 模型免费使用 Cherry Studio 多模型支持 硅基流动合作 AI 交互体验优化 Cherry Studio 与硅基流动合作
2025-08-23 11:32:18 45人关注
刷新科技前沿!InternLM推出8B参数的轻量级多模态推理模型
近日,InternLM 团队正式发布了其开源的轻量级多模态推理模型 ——Intern-S1-mini。该模型参数仅为8B,结合了先进的 Qwen3-8B 语言模型与0.3B 视觉编码器 InternViT,展现出强大的处理能力和灵活性。
InternLM开源模型 轻量级多模态推理 Intern-S1-mini参数 Qwen3-8B语言模型 InternViT视觉编码器
2025-08-20 17:45:22 39人关注
快手 Klear-Reasoner 模型成功登顶,数学推理准确率超 90%
在大语言模型的竞争中,数学和代码推理能力已成为一项重要的评估标准。快手最近发布的 Klear-Reasoner 模型基于 Qwen3-8B-Base 打造,其在多个权威基准测试中表现出色,数学推理的准确率甚至突破了90%,成为同规模模型中的佼佼者。
Klear-Reasoner 大语言模型数学推理 代码推理能力评估 Qwen3-8B-Base 模型 权威基准测试表现 同规模模型性能对比
2025-08-14 11:25:42 73人关注
基于Qwen3-4B-Thinking模型微调 Jan-v1模型强势挑战Perplexity Pro
近日,开源AI领域迎来重磅消息。一款名为Jan-v1的深度研究模型正式发布,基于阿里云Qwen3-4B-Thinking模型精心微调,直接对标商业化产品Perplexity Pro。这款仅有4亿参数的模型凭借91%的SimpleQA准确率、完全本地运行能力以及对推理和工具使用的专项优化,迅速成为AI开发者社区的关注焦点。
开源AI模型 Jan-v1模型特点 本地运行AI模型 AI模型微调技术 Perplexity Pro对标产品 SimpleQA准确率提升
2025-08-07 11:26:33 119人关注
阿里新发布Qwen3-4B模型:小巧强劲,手机也能跑 AI!
阿里巴巴通义千问团队推出全新Qwen3-4B系列模型,包括Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507两个版本。这一发布标志着小型语言模型(SLM)技术的重要突破,为移动端AI应用开辟了新的发展路径。
阿里巴巴通义千问 Qwen3-4B系列模型 Qwen3-4B-Instruct-2507 Qwen3-4B-Thinking-2507 小型语言模型SLM技术 移动端AI应用
2025-08-07 10:34:32 68人关注
通义千问推出Qwen3-4B系列小模型 手机也能轻松跑
通义千问宣布Qwen3-4B系列模型的发布。这一新模型以其小巧的体积和强大的性能,为人工智能的端侧部署带来了新的可能性。
2025-07-30 10:18:28 255人关注
通义千问开源Qwen3-30B-A3B-Instruct-2507非思考模式模型
7月29日,Qwen3-30B-A3B模型推出了新版本Qwen3-30B-A3B-Instruct-2507。这一新版本在多个关键领域实现了显著提升,标志着该模型在非思考模式(non-thinking mode)下仅激活3B参数,就能达到与Gemini2.5-Flash(non-thinking)、GPT-4o等顶尖闭源模型相媲美的性能。
2025-07-26 17:39:27 203人关注
通义灵码宣布上线Qwen3-Coder 免费使用不限量
通义灵码宣布上线全新的Qwen3-Coder模型,并且这一强大功能将免费向用户开放,使用量不受限制。
2025-07-25 12:33:42 178人关注
阿里通义千问AI编程大模型Qwen3-Coder登顶榜首
在7月24日,全球最大的 AI 开源社区 Hugging Face 发布了最新的大模型排行榜,令人瞩目的阿里巴巴 Qwen3-Coder 成功登顶,成为全球热度最高的开源 AI 编程模型,甚至超越了备受瞩目的 GPT-4.1和 Claude4。
Hugging Face 大模型排行榜 阿里巴巴 Qwen3-Coder 开源 AI 编程模型 GPT-4.1 对比 Qwen3-Coder Claude4 与 Qwen3-Coder 性能比较 全球 AI 编程模型热度排名
2025-07-25 10:11:35 238人关注
通义千问Qwen推出机器翻译模型Qwen-MT 基于Qwen 3打造
Qwen-MT机器翻译模型正式发布,Qwen-MT基于强大的Qwen3模型,经过超大规模多语言和翻译数据的训练,结合强化学习技术,显著提升了翻译结果的准确性和语言流畅度。开发者可以通过Qwen API(qwen-mt-turbo)直接体验其快速且准确的翻译能力。
2025-07-24 10:38:27 534人关注
Qwen3-Coder上线阿里云百炼 价格比Claude 4便宜3倍
7月23日,阿里云正式推出了最新的 AI 编程大模型 ——Qwen3-Coder API。目前,Qwen3-Coder API已在阿里云百炼上线。这一全新的编程助手不仅功能强大,而且在价格上也极具竞争力,令人瞩目。
阿里云AI编程大模型 Qwen3-Coder API功能 Qwen3-Coder API价格优势 阿里云百炼AI编程助手 AI编程大模型应用场景
2025-07-22 13:33:19 184人关注
阿里通义千问重磅发布 Qwen3 模型,AI 技术再升级!
阿里通义千问近期宣布了其旗舰产品 Qwen3模型的最新更新,推出了一个名为 Qwen3-235B-A22B-Instruct-2507-FP8的新版本。这一新版本的亮点在于它采用了非思考模式(Non-thinking),并且大幅提升了长文本处理的能力,扩展到256K 的文本长度。这一升级无疑将大幅提升模型的应用潜力,特别是在需要处理大量信息的场景中。
阿里通义千问 Qwen3模型更新 Qwen3-235B-A22B-Instruct-2507-FP8 非思考模式 长文本处理能力 256K文本长度
2025-07-03 14:39:14 313人关注
DeepSWE 开源 AI Agent系统强势登顶,基于 Qwen3-32B
在人工智能领域,又一重磅消息传来。今天凌晨,知名大模型训练平台 Together.ai 与 Agentica 联合推出了开源 AI Agent框架 DeepSWE。这一创新系统是基于阿里最新开源的 Qwen3-32B 模型,完全通过强化学习进行训练。
Together.ai Agentica 开源AI Agent框架 DeepSWE Qwen3-32B模型 强化学习训练
2025-06-23 15:31:40 182人关注
Hey,Siri!你知道 Qwen3 全系适配 MLX 了吗?
通义千问(Qwen)3系列模型已全面适配苹果MLX框架,用户可通过MLX在苹果芯片设备上高效运行Qwen3系列大语言模型。这一适配使开发者能在MacBook等苹果设备本地部署Qwen3模型,包括Qwen1.8B、Qwen7B等不同规模版本,显著提升在苹果生态下的AI应用开发效率。MLX作为苹果专为机器学习优化的框架,其与Qwen3的兼容实现了在Apple Silicon上的原生加速,为开发者提供了更便捷的大模型本地化部署方案。该进展进一步拓展了Qwen系列模型的应用场景,使其能够更好地服务于苹果设备用户。
通义千问3系列 MLX框架适配 Qwen3苹果本地部署 Apple Silicon加速 大模型本地化部署方案 Qwen系列应用场景拓展
2025-06-23 15:17:45 182人关注
Qwen3-Embedding,这周很trending!
Qwen3-Embedding 近期成为热门话题,引发广泛关注。这一技术趋势的兴起可能与它在自然语言处理领域的突破性应用有关,或是其性能表现引发了业界的讨论。虽然具体技术细节和性能数据未在提供的内容中明确说明,但"trending"一词表明该模型或方法在当前AI社区具有较高的讨论度和影响力。其热度可能源于相比前代模型的显著改进,或是在特定任务(如文本嵌入、语义理解等)上展现出的优越性。这一现象反映了AI领域对高效嵌入技术的持续需求,以及开源社区对前沿模型的快速响应。
2025-06-20 16:40:14 90人关注
接入通义千问3后,B站618期间商单成交效率提升5倍+
B站近期接入通义千问Qwen3、Qwen-VL等模型推出数据洞察智能体InsightAgent,显著提升了其商业平台“花火”和“必达”的运营效率。618期间,“花火”平台商单成交效率提升5倍以上,“必达”平台数据洞察效率提升3倍以上。花火平台新增的AI选人功能可基于品牌需求和UP主数据自动匹配,并推荐创意方向,解决了以往人工筛选效率低、主观性强的问题。必达平台则利用InsightAgent实现智能报告生成,包括人群推荐、行业趋势分析等。B站相关负责人表示,通义系列模型尤其是Qwen3的混合思考模式能高效处理简单和复杂问题,在节省算力的同时满足品牌需求。
B站通义千问Qwen3 花火平台AI选人功能 必达平台智能报告生成 通义千问Qwen-VL模型 InsightAgent数据洞察智能体 618商单成交效率提升