- 上云资讯 -
2025-09-08 10:18:16 42人关注
微软推出新型 AI Agent 模型 rStar2-Agent,以 140 亿参数挑战大规模模型
微软最近在 AI 领域取得了显著突破,开源了一款名为 rStar2-Agent 的 AI Agent 推理模型。这款模型采用了创新的智能体强化学习方法,令人惊讶的是,尽管其参数仅有140亿,但在 AIME24数学推理测试中,准确率高达80.6%,成功超越了拥有6710亿参数的 DeepSeek-R1(79.8%)。这样的表现让人们重新思考模型的参数规模与性能之间的关系。
2025-09-05 13:13:19 314人关注
瑞士重磅发布自主开源AI大模型Apertus
在全球人工智能技术蓬勃发展的背景下,瑞士于近日正式推出了其首个完全开源的大语言模型 ——Apertus。这一模型由瑞士联邦理工学院(EPFL)、苏黎世联邦理工学院(ETH Zurich)以及国家超级计算中心(CSCS)共同研发,标志着瑞士在人工智能领域的自主创新迈出了重要一步。
瑞士Apertus大语言模型 开源AI模型 瑞士人工智能创新 EPFL人工智能研究 ETH Zurich语言模型 CSCS超级计算 瑞士自主AI技术
2025-08-27 09:22:16 155人关注
阿里国际发布多模态大模型 Ovis2.5,推动视觉感知与深度推理新进展
近日,阿里国际正式发布了其新一代多模态大模型 Ovis2.5,并对外开源。这款模型专注于原生分辨率视觉感知、深度推理以及高性价比的场景设计,旨在进一步提升人工智能的应用能力。Ovis2.5在主流多模态评测套件 OpenCompass 上的综合得分相比前一版本 Ovis2有了显著提升,继续在同类开源模型中保持 SOTA(最先进技术)水平。
阿里国际Ovis2.5 多模态大模型 开源AI模型 原生分辨率视觉感知 深度推理 高性价比AI OpenCompass评测 SOTA开源模型
2025-08-14 11:25:42 72人关注
基于Qwen3-4B-Thinking模型微调 Jan-v1模型强势挑战Perplexity Pro
近日,开源AI领域迎来重磅消息。一款名为Jan-v1的深度研究模型正式发布,基于阿里云Qwen3-4B-Thinking模型精心微调,直接对标商业化产品Perplexity Pro。这款仅有4亿参数的模型凭借91%的SimpleQA准确率、完全本地运行能力以及对推理和工具使用的专项优化,迅速成为AI开发者社区的关注焦点。
开源AI模型 Jan-v1模型特点 本地运行AI模型 AI模型微调技术 Perplexity Pro对标产品 SimpleQA准确率提升
2025-07-12 16:12:20 686人关注
月之暗面Kimi K2 模型发布并开源 擅长代码与 Agentic 任务
月之暗面公司正式发布了其最新力作——Kimi K2模型,并同步宣布开源。这款基于MoE架构的基础模型,凭借其强大的代码能力、卓越的通用Agent任务处理能力,一经发布便在AI领域引起了广泛关注。
2025-06-23 15:17:45 182人关注
Qwen3-Embedding,这周很trending!
Qwen3-Embedding 近期成为热门话题,引发广泛关注。这一技术趋势的兴起可能与它在自然语言处理领域的突破性应用有关,或是其性能表现引发了业界的讨论。虽然具体技术细节和性能数据未在提供的内容中明确说明,但"trending"一词表明该模型或方法在当前AI社区具有较高的讨论度和影响力。其热度可能源于相比前代模型的显著改进,或是在特定任务(如文本嵌入、语义理解等)上展现出的优越性。这一现象反映了AI领域对高效嵌入技术的持续需求,以及开源社区对前沿模型的快速响应。
2025-05-26 18:24:29 230人关注
阿里全面开源文生视频模型万相2.1:14B和1.3B双版本上线
今日,阿里巴巴官方宣布全面开源旗下视频生成模型万相2.1模型,14B和1.3B双版本上线。其中,专业版14B,高性能,提供业界顶尖的表现力可满足对视频质量有极高要求的场景;而极速版1.3B,适合消费级显卡,8.2GB显存即可生成480P高质量视频,适用于二次模型开发和学术研究。
2025-05-13 10:36:18 106人关注
Google Gemma AI 模型下载量突破 1.5 亿次
Google 近期宣布,其人工智能模型集合 Gemma 的下载量已经突破1.5亿次,标志着该项目取得了显著进展。Google DeepMind 的开发者关系工程师 Omar Sanseviero 在社交平台 X 上分享了这一消息,并透露,目前在人工智能开发平台 Hugging Face 上,开发者们已经创造出了超过7万个不同版本的 Gemma 模型。
2025-04-30 10:26:15 109人关注
Meta Llama AI模型下载量突破12亿,开发者热情高涨
在人工智能领域,Meta 公司近期传来了一个令人振奋的消息:其 “开放式” AI 模型系列 Llama 的下载量已突破12亿次。这个数字在不久前的3月中旬刚刚达到10亿次,显示出 Llama 模型在开发者和用户中获得的广泛认可和热情。
2025-03-17 16:24:20 171人关注
Luma开源图像模型预训练技术IMM 采样效率提高10倍
人工智能初创公司Luma近日在X平台宣布,其开源了一项名为Inductive Moment Matching(IMM)的图像模型预训练技术。这一突破性技术以其高效和稳定的特性引发了广泛关注,被认为是生成式AI领域的一次重要进步。
2025-03-03 10:29:21 237人关注
DeepSeek开源周第六天:极致推理优化系统,提高GPU计算效率
在人工智能(AI)技术快速发展的今天,DeepSeek 团队推出了其全新的 DeepSeek-V3/R1推理系统。这一系统旨在通过更高的吞吐量和更低的延迟,推动 AGI(通用人工智能)的高效发展。为了实现这一目标,DeepSeek 采用了跨节点专家并行(Expert Parallelism,EP)技术,显著提高了 GPU 的计算效率,并在降低延迟的同时,扩展了批处理规模。
2025-01-26 20:17:12 281人关注
研究人员开源推理型人工智能模型Sky-T1 训练成本不到450美元
近日,加州大学伯克利分校的 Sky Computing Lab 团队发布了 Sky-T1-32B-Preview,这是一款开放源代码的推理型人工智能模型,标志着推理型 AI 的研发变得更加容易和便宜。该模型在多个关键基准测试中表现出色,甚至与 OpenAI 早期版本的 o1相媲美。
2025-01-26 16:28:29 217人关注
开源推理AI模型Sky-T1横空出世,训练成本不到 450 美元
加州大学伯克利分校天空计算实验室的研究团队NovaSky于周五发布了Sky-T1-32B-Preview推理模型,这一模型在多个关键基准测试中表现优异,与OpenAI的o1早期版本相媲美,更令人瞩目的是其极低的训练成本。