上云资讯 - 来上云吧，企业上云一站式服务

2025-09-20 12:17:25 308人关注

通义DeepResearch发布！全开源AI模型让研究更简单

在人工智能领域，通义 DeepResearch 团队最新发布的研究成果引发了广泛关注。这一突破性进展不仅使 AI 从 “能聊天” 跃升至 “会做研究”，更是以开放的姿态向世界展示了其卓越的性能。通义 DeepResearch 在多个权威基准测试中取得了最先进的成绩，整体能力甚至超过了许多国际知名模型，并且模型、框架及方案都实现了完全开源，真正把深度研究的生产力带给每个人。

AI

2025-09-08 10:18:16 240人关注

微软推出新型 AI Agent 模型 rStar2-Agent，以 140 亿参数挑战大规模模型

微软最近在 AI 领域取得了显著突破，开源了一款名为 rStar2-Agent 的 AI Agent 推理模型。这款模型采用了创新的智能体强化学习方法，令人惊讶的是，尽管其参数仅有140亿，但在 AIME24数学推理测试中，准确率高达80.6%，成功超越了拥有6710亿参数的 DeepSeek-R1（79.8%）。这样的表现让人们重新思考模型的参数规模与性能之间的关系。

AI Agent 推理模型智能体强化学习模型参数规模与性能数学推理测试小参数模型优势开源AI模型

2025-09-05 13:13:19 656人关注

瑞士重磅发布自主开源AI大模型Apertus

在全球人工智能技术蓬勃发展的背景下，瑞士于近日正式推出了其首个完全开源的大语言模型 ——Apertus。这一模型由瑞士联邦理工学院（EPFL）、苏黎世联邦理工学院(ETH Zurich)以及国家超级计算中心(CSCS)共同研发，标志着瑞士在人工智能领域的自主创新迈出了重要一步。

瑞士Apertus大语言模型开源AI模型瑞士人工智能创新 EPFL人工智能研究 ETH Zurich语言模型 CSCS超级计算瑞士自主AI技术

2025-08-27 09:22:16 410人关注

阿里国际发布多模态大模型 Ovis2.5，推动视觉感知与深度推理新进展

近日，阿里国际正式发布了其新一代多模态大模型 Ovis2.5，并对外开源。这款模型专注于原生分辨率视觉感知、深度推理以及高性价比的场景设计，旨在进一步提升人工智能的应用能力。Ovis2.5在主流多模态评测套件 OpenCompass 上的综合得分相比前一版本 Ovis2有了显著提升，继续在同类开源模型中保持 SOTA（最先进技术）水平。

阿里国际Ovis2.5 多模态大模型开源AI模型原生分辨率视觉感知深度推理高性价比AI OpenCompass评测 SOTA开源模型

2025-08-14 11:25:42 352人关注

基于Qwen3-4B-Thinking模型微调 Jan-v1模型强势挑战Perplexity Pro

近日，开源AI领域迎来重磅消息。一款名为Jan-v1的深度研究模型正式发布，基于阿里云Qwen3-4B-Thinking模型精心微调，直接对标商业化产品Perplexity Pro。这款仅有4亿参数的模型凭借91%的SimpleQA准确率、完全本地运行能力以及对推理和工具使用的专项优化，迅速成为AI开发者社区的关注焦点。

开源AI模型 Jan-v1模型特点本地运行AI模型 AI模型微调技术 Perplexity Pro对标产品 SimpleQA准确率提升

2025-07-12 16:12:20 1124人关注

月之暗面Kimi K2 模型发布并开源擅长代码与 Agentic 任务

月之暗面公司正式发布了其最新力作——Kimi K2模型，并同步宣布开源。这款基于MoE架构的基础模型，凭借其强大的代码能力、卓越的通用Agent任务处理能力，一经发布便在AI领域引起了广泛关注。

Kimi K2模型 MoE架构基础模型开源AI模型代码能力AI模型通用Agent任务处理月之暗面公司AI技术

2025-06-28 08:22:28 352人关注

腾讯开源轻量级混元-A13B模型 1张中低端GPU卡即可部署

腾讯正式发布并开源混元大模型家族的新成员——混元-A13B模型。该模型采用基于专家混合（MoE）架构，总参数规模达800亿，激活参数为130亿，在保持顶尖开源模型效果的同时，大幅降低了推理延迟与计算开销，为个人开发者和中小企业提供了更具性价比的AI解决方案。

腾讯混元大模型混元-A13B模型 MoE架构开源AI模型 AI推理优化中小企业AI解决方案

2025-06-23 15:17:45 501人关注

Qwen3-Embedding，这周很trending！

Qwen3-Embedding 近期成为热门话题，引发广泛关注。这一技术趋势的兴起可能与它在自然语言处理领域的突破性应用有关，或是其性能表现引发了业界的讨论。虽然具体技术细节和性能数据未在提供的内容中明确说明，但"trending"一词表明该模型或方法在当前AI社区具有较高的讨论度和影响力。其热度可能源于相比前代模型的显著改进，或是在特定任务（如文本嵌入、语义理解等）上展现出的优越性。这一现象反映了AI领域对高效嵌入技术的持续需求，以及开源社区对前沿模型的快速响应。

Qwen3-Embedding 自然语言处理技术 AI模型趋势文本嵌入技术语义理解模型开源AI模型

2025-05-27 08:24:17 343人关注

DeepSeek开源周第3天：发布DeepGEMM，FP8 GEMM库助力AI训练与推理

中国人工智能公司DeepSeek在其“开源周”第3天宣布推出DeepGEMM——一款支持FP8通用矩阵乘法（GEMM）的开源库。这一工具专为密集型和混合专家(MoE)矩阵运算设计，为DeepSeek V3和R1模型的训练与推理提供强大支持。官方消息通过X平台发布，迅速引发技术社区的热烈反响。

DeepSeek开源周 DeepGemm FP8训练 AI推理优化 AI训练加速开源AI模型

2025-05-26 18:24:29 441人关注

阿里全面开源文生视频模型万相2.1：14B和1.3B双版本上线

今日，阿里巴巴官方宣布全面开源旗下视频生成模型万相2.1模型，14B和1.3B双版本上线。其中，专业版14B，高性能，提供业界顶尖的表现力可满足对视频质量有极高要求的场景;而极速版1.3B，适合消费级显卡，8.2GB显存即可生成480P高质量视频，适用于二次模型开发和学术研究。

阿里开源视频生成模型万相2.1 视频生成技术开源AI模型阿里巴巴AI技术

2025-05-26 16:31:35 459人关注

字节跳动推出开源多模态模型BAGE 从图像生成到世界建模

字节跳动近日正式发布其最新开源多模态基础模型——BAGEL（Big Advanced Generalized Embodied Learner），以70亿个有效参数的规模，开启多模态AI模型的新阶段。BAGEL在图像理解、生成和编辑等关键任务中表现卓越，已在多个标准评测中超越当前主流开源视觉语言模型(VLM)，如Qwen2.5-VL和InternVL-2.5。

字节跳动开源多模态模型 Bage 多模态AI技术开源AI模型大模型技术发展

2025-05-13 10:36:18 217人关注

Google Gemma AI 模型下载量突破 1.5 亿次

Google 近期宣布，其人工智能模型集合 Gemma 的下载量已经突破1.5亿次，标志着该项目取得了显著进展。Google DeepMind 的开发者关系工程师 Omar Sanseviero 在社交平台 X 上分享了这一消息，并透露，目前在人工智能开发平台 Hugging Face 上，开发者们已经创造出了超过7万个不同版本的 Gemma 模型。

Google Gemma AI AI模型下载 Google AI技术开源AI模型 Gemma AI应用

2025-04-30 10:26:15 216人关注

Meta Llama AI模型下载量突破12亿，开发者热情高涨

在人工智能领域，Meta 公司近期传来了一个令人振奋的消息:其 “开放式” AI 模型系列 Llama 的下载量已突破12亿次。这个数字在不久前的3月中旬刚刚达到10亿次，显示出 Llama 模型在开发者和用户中获得的广泛认可和热情。

Meta Llama AI AI大模型下载 Llama 12B模型 Meta AI技术开源AI模型下载

2025-04-29 16:27:36 237人关注

李彦宏解读文心大模型 4.5 开源的意义：开源促进技术普及

在最近的财报电话会上，百度创始人李彦宏就文心大模型4.5系列的开源决策进行了深入的分析。他表示，从其自主研发的 DeepSeek 项目中，百度深刻认识到开源的最佳模型将大大推动用户的使用和接受程度。当一个强大的模型实现开源时，自然会吸引更多的人出于好奇心进行尝试，这样的行为不仅能够促进技术的普及，也会带来更广泛的应用。

李彦宏文心一言4.5 开源意义开源AI模型百度AI技术

2025-03-27 16:41:31 620人关注

全球开源大模型榜单揭晓，阿里通义千问独占鳌头

近日，全球最大人工智能开源社区 Huggingface 发布了最新的开源大模型排行榜（Open LLM Leaderboard），结果显示，排名前十的开源大模型全都是基于阿里通义千问(Qwen)开源模型进行二次训练的衍生模型。这一成就标志着 Qwen 在开源 AI 领域的主导地位，进一步推动了其在全球的影响力。

全球开源模型排名阿里通义开源模型开源模型排行榜阿里通义模型评测开源AI模型比较

2025-03-17 16:24:20 343人关注

Luma开源图像模型预训练技术IMM 采样效率提高10倍

人工智能初创公司Luma近日在X平台宣布，其开源了一项名为Inductive Moment Matching（IMM）的图像模型预训练技术。这一突破性技术以其高效和稳定的特性引发了广泛关注，被认为是生成式AI领域的一次重要进步。

Luma开源图像模型图像模型预训练开源AI模型图像生成技术 Luma模型架构

2025-03-06 10:18:18 1022人关注

阿里新开源推理大模型QwQ-32B，性能媲美DeepSeek-R1、显存需求更小

阿里巴巴旗下的Qwen团队近日推出了其最新的开源大型语言模型（LLM）家族成员——QwQ-32B。这款拥有320亿参数的推理模型，旨在通过强化学习（RL）提升在复杂问题解决任务上的性能。

阿里开源模型 QWQ-32B 开源推理模型阿里大模型开源AI模型大模型推理技术

2025-03-03 10:29:21 455人关注

DeepSeek开源周第六天：极致推理优化系统，提高GPU计算效率

在人工智能（AI）技术快速发展的今天，DeepSeek 团队推出了其全新的 DeepSeek-V3/R1推理系统。这一系统旨在通过更高的吞吐量和更低的延迟，推动 AGI(通用人工智能)的高效发展。为了实现这一目标，DeepSeek 采用了跨节点专家并行(Expert Parallelism，EP)技术，显著提高了 GPU 的计算效率，并在降低延迟的同时，扩展了批处理规模。

DeepSeek开源周报 GPU计算优化 DeepSeek技术更新开源AI模型优化高性能计算优化

2025-02-08 16:25:19 690人关注

开源去背景抠图模型BEN2，图片和视频都能去除背景

近日，PramaLLC 推出了其最新的人工智能模型 —— 背景消除网络 BEN2（Background Erase Network），该模型在前景分割技术上做出了显著创新。BEN2采用了信心引导抠图(Confidence Guided Matting，CGM)管道，利用一个精炼网络专门处理基础模型信心较低的像素，从而获得更为精准、可靠的抠图效果。

开源背景去除模型背景去除技术开源AI模型 Ben2模型应用 AI背景去除工具图像处理开源方案

2025-01-26 20:17:12 444人关注

研究人员开源推理型人工智能模型Sky-T1 训练成本不到450美元

近日，加州大学伯克利分校的 Sky Computing Lab 团队发布了 Sky-T1-32B-Preview，这是一款开放源代码的推理型人工智能模型，标志着推理型 AI 的研发变得更加容易和便宜。该模型在多个关键基准测试中表现出色，甚至与 OpenAI 早期版本的 o1相媲美。

开源AI模型 Sky T1模型 AI模型开源研究人员开源模型 Sky T1 AI技术

- 上云资讯 -

通义DeepResearch发布！全开源AI模型让研究更简单

微软推出新型 AI Agent 模型 rStar2-Agent，以 140 亿参数挑战大规模模型

瑞士重磅发布自主开源AI大模型Apertus

阿里国际发布多模态大模型 Ovis2.5，推动视觉感知与深度推理新进展

基于Qwen3-4B-Thinking模型微调 Jan-v1模型强势挑战Perplexity Pro

月之暗面Kimi K2 模型发布并开源擅长代码与 Agentic 任务

腾讯开源轻量级混元-A13B模型 1张中低端GPU卡即可部署

Qwen3-Embedding，这周很trending！

DeepSeek开源周第3天：发布DeepGEMM，FP8 GEMM库助力AI训练与推理

阿里全面开源文生视频模型万相2.1：14B和1.3B双版本上线

字节跳动推出开源多模态模型BAGE 从图像生成到世界建模

Google Gemma AI 模型下载量突破 1.5 亿次

Meta Llama AI模型下载量突破12亿，开发者热情高涨

李彦宏解读文心大模型 4.5 开源的意义：开源促进技术普及

全球开源大模型榜单揭晓，阿里通义千问独占鳌头

Luma开源图像模型预训练技术IMM 采样效率提高10倍

阿里新开源推理大模型QwQ-32B，性能媲美DeepSeek-R1、显存需求更小

DeepSeek开源周第六天：极致推理优化系统，提高GPU计算效率

开源去背景抠图模型BEN2，图片和视频都能去除背景

研究人员开源推理型人工智能模型Sky-T1 训练成本不到450美元

推荐阅读

上云服务

- 上云资讯 -

通义DeepResearch发布！全开源AI模型让研究更简单

​微软推出新型 AI Agent 模型 rStar2-Agent，以 140 亿参数挑战大规模模型

瑞士重磅发布自主开源AI大模型Apertus

​阿里国际发布多模态大模型 Ovis2.5，推动视觉感知与深度推理新进展

基于Qwen3-4B-Thinking模型微调 Jan-v1模型强势挑战Perplexity Pro

月之暗面Kimi K2 模型发布并开源 擅长代码与 Agentic 任务

腾讯开源轻量级混元-A13B模型 1张中低端GPU卡即可部署

Qwen3-Embedding，这周很trending！

DeepSeek开源周第3天：发布DeepGEMM，FP8 GEMM库助力AI训练与推理

阿里全面开源文生视频模型万相2.1：14B和1.3B双版本上线

字节跳动推出开源多模态模型BAGE 从图像生成到世界建模

​Google Gemma AI 模型下载量突破 1.5 亿次

Meta Llama AI模型下载量突破12亿，开发者热情高涨

李彦宏解读文心大模型 4.5 开源的意义：开源促进技术普及

全球开源大模型榜单揭晓，阿里通义千问独占鳌头

Luma开源图像模型预训练技术IMM 采样效率提高10倍

​阿里新开源推理大模型QwQ-32B，性能媲美DeepSeek-R1、显存需求更小

DeepSeek开源周第六天：极致推理优化系统，提高GPU计算效率

开源去背景抠图模型BEN2，图片和视频都能去除背景

研究人员开源推理型人工智能模型Sky-T1 训练成本不到450美元

推荐阅读

上云服务

微软推出新型 AI Agent 模型 rStar2-Agent，以 140 亿参数挑战大规模模型

阿里国际发布多模态大模型 Ovis2.5，推动视觉感知与深度推理新进展

月之暗面Kimi K2 模型发布并开源擅长代码与 Agentic 任务

Google Gemma AI 模型下载量突破 1.5 亿次

阿里新开源推理大模型QwQ-32B，性能媲美DeepSeek-R1、显存需求更小