上云资讯 - 来上云吧，企业上云一站式服务

2025-12-18 18:36:36 388人关注

微软开源 TRELLIS.2：一键将图片转为高精度 3D 模型

近日，微软正式开源了其最新的图像到3D 模型生成工具 ——TRELLIS.2。该工具在生成高质量、带材质的3D 模型方面表现出色，仅需输入一张图片，便可迅速生成可供 Blender、Unity、Unreal 等平台使用的.glb 格式三角形网格文件。

AI

2025-12-18 12:38:20 312人关注

苹果开源 SHARP 模型:告别漫长等待，1秒让平面照片跃升3D 空间

在3D 内容创作领域，苹果公司近日投下了一枚“深水炸弹”。据科技媒体9to5Mac 披露，苹果正式开源了一款名为SHARP的新型 AI 模型。这项技术最令人惊叹之处在于，它打破了传统3D 重建动辄数小时的耗时瓶颈，仅需不到一秒钟，就能将一张普通的2D 照片转化为具有真实物理比例的3D 场景。

AI

2025-12-17 11:11:32 452人关注

小米开源3090亿参数MiMo-V2-Flash大模型，推理速度碾压主流竞品，API低至0.1美元/百万Token

小米正式进军高性能开源大模型赛道。近日，公司发布了全新基础语言模型 MiMo-V2-Flash，并同步以 MIT协议全面开源模型权重与推理代码。该模型以“超高速、高效率”为核心卖点，在推理、代码生成与智能体任务中表现尤为突出，实测响应速度甚至超越当前热门的豆包、DeepSeek和元宝等国产模型，引发开发者社区广泛关注。

AI

2025-12-16 16:10:43 136人关注

IBM 发布 CUGA：一款开源 AI 助手，任务完成率超六成

近日，IBM 研究人员推出了一款名为 CUGA 的开源 AI 助手，旨在自动化复杂的企业工作流程，并能完成超过一半的任务。CUGA 代表 “可配置通用代理”，该软件通过多代理编排、API 集成和代码生成等功能，力求帮助知识工作者更高效地处理日常或复杂的工作。

AI

2025-12-16 13:20:24 281人关注

开源AI大模型大比拼：国产三强并列第一，硅谷巨头陷落！

在最近的开源 AI 大模型评比中，中国的开源 AI 技术再一次展现出强大的实力，DeepSeek、Qwen 和 Kimi 三款模型被评为影响力并列第一，这一消息引发了业界的广泛关注。由 AI 研究员 Nathan Lambert 和 Florian Brand 共同发布的这份榜单，涵盖了35家机构，其中超过一半是中国团队。这显示出中国在开源领域的迅猛发展，和美国企业的闭源选择形成鲜明对比。

AI

2025-12-15 16:44:21 196人关注

领跑全球榜单超两月，蚂蚁数科宣布数据智能体关键技术开源

12月13日，第二届CCF中国数据大会上，蚂蚁数科宣布开源旗下数据智能体关键技术Agentar SQL全套论文、代码、模型和使用指南。该智能体技术可让非专业人员通过日常语言进行商业数据查询和分析，为企业数智化提供更精准可用的智能数据分析基座。

AI

2025-12-13 11:37:14 201人关注

Mistral重磅开源Devstral 2：123B编码神器+SWE-bench 72.2分，免费API+本地CLI炸裂来袭！

欧洲AI独角兽Mistral AI再度发力，正式发布新一代专为编码设计的开源模型家族Devstral2，包括123B参数的旗舰版Devstral2和24B参数的轻量版Devstral Small2。同时配套推出开源命令行工具Mistral Vibe CLI，支持端到端自动化编程。这一波更新直接将开源编码Agent推向新高度，Devstral2在权威基准SWE-bench Verified上斩获72.2分，逼近顶级闭源模型，同时API现阶段免费开放，堪称开发者福音。

AI

2025-12-13 09:18:29 196人关注

蚂蚁开源 LLaDA2.0，业内首个100B 参数规模的扩散语言模型

在大语言模型技术发展的新潮流中，蚂蚁技术研究院于近日正式发布了 LLaDA2.0系列，这是业内首个参数规模达到100B 的离散扩散大语言模型（dLLM）。这一创新的模型不仅打破了扩散模型难以规模化的固有印象，还在生成质量和推理速度上实现了显著的提升，为大语言模型领域开辟了新的发展方向。

AI

2025-12-12 16:13:36 174人关注

Meta开源神话崩塌：闭源新模型竟靠阿里Qwen训练，小扎“煲汤求才”换来战略大转向

曾经高举开源大旗、以“AI时代的安卓”自居的Meta，正悄然走上一条截然相反的道路。彭博社最新爆料称，Meta计划于2026年春季发布代号“Avocado”（牛油果）的全新AI模型——而这款模型，极有可能是闭源的。更令人震惊的是，其训练过程中竟直接使用了阿里巴巴的开源大模型Qwen。

AI

2025-12-10 17:18:12 244人关注

Mistral 发布 Devstral2 开源编程模型：1230 亿参数，成本仅 Claude Sonnet 1/7

Mistral AI 正式推出第二代开源编码模型家族:Devstral2（1230亿参数旗舰版）与 Devstral Small2(240亿参数轻量版)。旗舰模型在 SWE-Bench Verified 基准拿下72.2% 得分，刷新开源类别最佳成绩;官方宣称「成本效益比 Claude Sonnet 低7倍」，并同步开源 CLI 工具 Mistral Vibe，支持自然语言批量改代码。两款模型已上线 API，Devstral2每百万输入 token0.40美元，轻量版完全免费。

AI

2025-12-10 11:16:16 209人关注

Mistral AI发布第二代开源编码模型:Devstral2性能超群，采用差异化许可策略

Mistral AI 正式推出其第二代开源编码模型家族:Devstral2 和 Devstral Small2。此次发布的核心亮点是旗舰模型在性能上实现突破，同时该公司采用了针对不同规模模型的差异化许可策略。

AI

2025-12-10 10:41:33 153人关注

全球科技巨头联合成立 AI 代理基金会，推动开源技术标准化

随着人工智能技术的快速发展，AI 代理工具与互联网生态之间的矛盾日益显现。为了应对这一挑战，谷歌、微软、亚马逊、OpenAI 等一众行业领军公司于周二联合宣布成立 “AI 代理基金会”（AAIF）。该基金会的目标是合作制定与 AI 代理相关的开源技术标准，这一举措的意义相当于全球银行在跨行电子支付方面所做的标准化工作，但这次的焦点是应用数据的互联。

AI

2025-12-10 08:29:12 316人关注

AI日报：蚂蚁推灵光网页版AI助手；智谱开源GLM-4.6V系列；谷歌Mixboard重磅升级

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

AI

2025-12-09 13:33:24 356人关注

智谱重磅开源 AutoGLM:能点外卖、订机票的手机级 AI Agent 向所有人开放

智谱今日宣布正式开源其核心 AI Agent 模型 AutoGLM，这一具备“Phone Use”能力的智能体能够稳定完成外卖点单、机票预订等长达数十步的复杂手机操作流程。开源意味着任何硬件厂商、手机厂商及开发者，都可以在自己的系统中复现一个能“看懂屏幕”、并能像真人一样完成点击、输入、滑动等操作的 AI 助手。

AI

2025-12-09 12:40:18 266人关注

智谱开源 GLM-4.6V 系列：106B 原生支持 Function Call，轻量版 9B 免费商用

智谱正式并上线开源 GLM-4.6V 多模态大模型系列，含基础版 GLM-4.6V（总参106B，激活12B）与轻量版 GLM-4.6V-Flash(9B)。新模型将上下文窗口提升至128k tokens，视觉理解精度达同参数 SOTA，首次把 Function Call 能力原生融入视觉模型，打通「视觉感知 → 可执行行动」完整链路。 API 价格较 GLM-4.5V 下降50%，输入1元 / 百万 tokens、输出3元 / 百万 tokens;GLM-4.6V-Flash 完全免费，已集成 GLM Coding Plan 与专用 MCP 工具，开发者可零成本商用。

AI

2025-12-06 12:44:38 337人关注

微软开源实时语音模型VibeVoice-Realtime-0.5B，300ms实时开声，90分钟长音频都不喘！

微软悄然开源了一枚“黑马级”实时语音模型:VibeVoice-Realtime-0.5B。这可能是目前全球延迟最低、表现最接近真人的开源文本转语音（TTS）模型之一，话还没说完，声音就已经开始了!

AI

2025-12-04 15:41:15 266人关注

AI日报：Kling 2.6将发布；千问APP推学习大模型；Z-Image-Turbo-Fun-Controlnet-Union 开源

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

AI

2025-12-03 15:18:11 451人关注

vLLM-Omni开源:把扩散模型、ViT、LLM塞进一条流水线，多模态推理一次跑完

vLLM团队发布首个“全模态”推理框架vLLM-Omni，将文本、图像、音频、视频的统一生成从概念验证变成可落地代码。新框架已上线GitHub与ReadTheDocs，开发者可立即pip安装并调用。

AI

2025-12-03 12:16:18 197人关注

商汤NEO开源:用1/10数据量媲美顶级多模态模型，终结"拼凑式"AI时代

商汤科技与南洋理工大学S-Lab联合发布并开源全新多模态模型架构NEO，通过底层架构创新实现视觉与语言的深层统一，在性能、效率和通用性上取得全面突破。

AI

2025-12-03 11:13:45 627人关注

阿里通义实验室再出王炸!Z-Image-Turbo-Fun-Controlnet-Union 开源，6B 参数秒杀 Flux

2阿里巴巴通义实验室今日正式开源 Z-Image-Turbo-Fun-Controlnet-Union，这款全新 ControlNet 模型标志着其 Z-Image 系列图像生成生态的重大扩展。作为 AIbase 独家追踪的开源 AI 动态，此次发布进一步强化了 Z-Image-Turbo 在精确控制与创意生成方面的领先优势，迅速引发全球开发者与创作者的热议。

AI

- 上云资讯 -

微软开源 TRELLIS.2：一键将图片转为高精度 3D 模型

苹果开源 SHARP 模型:告别漫长等待，1秒让平面照片跃升3D 空间

小米开源3090亿参数MiMo-V2-Flash大模型，推理速度碾压主流竞品，API低至0.1美元/百万Token

IBM 发布 CUGA：一款开源 AI 助手，任务完成率超六成

开源AI大模型大比拼：国产三强并列第一，硅谷巨头陷落！

领跑全球榜单超两月，蚂蚁数科宣布数据智能体关键技术开源

Mistral重磅开源Devstral 2：123B编码神器+SWE-bench 72.2分，免费API+本地CLI炸裂来袭！

蚂蚁开源 LLaDA2.0，业内首个100B 参数规模的扩散语言模型

Meta开源神话崩塌：闭源新模型竟靠阿里Qwen训练，小扎“煲汤求才”换来战略大转向

Mistral 发布 Devstral2 开源编程模型：1230 亿参数，成本仅 Claude Sonnet 1/7

Mistral AI发布第二代开源编码模型:Devstral2性能超群，采用差异化许可策略

全球科技巨头联合成立 AI 代理基金会，推动开源技术标准化

AI日报：蚂蚁推灵光网页版AI助手；智谱开源GLM-4.6V系列；谷歌Mixboard重磅升级

智谱重磅开源 AutoGLM:能点外卖、订机票的手机级 AI Agent 向所有人开放

智谱开源 GLM-4.6V 系列：106B 原生支持 Function Call，轻量版 9B 免费商用

微软开源实时语音模型VibeVoice-Realtime-0.5B，300ms实时开声，90分钟长音频都不喘！

AI日报：Kling 2.6将发布；千问APP推学习大模型；Z-Image-Turbo-Fun-Controlnet-Union 开源

vLLM-Omni开源:把扩散模型、ViT、LLM塞进一条流水线，多模态推理一次跑完

商汤NEO开源:用1/10数据量媲美顶级多模态模型，终结"拼凑式"AI时代

阿里通义实验室再出王炸!Z-Image-Turbo-Fun-Controlnet-Union 开源，6B 参数秒杀 Flux

推荐阅读

上云服务

- 上云资讯 -

​微软开源 TRELLIS.2：一键将图片转为高精度 3D 模型

苹果开源 SHARP 模型:告别漫长等待，1秒让平面照片跃升3D 空间

小米开源3090亿参数MiMo-V2-Flash大模型，推理速度碾压主流竞品，API低至0.1美元/百万Token

IBM 发布 CUGA：一款开源 AI 助手，任务完成率超六成

开源AI大模型大比拼：国产三强并列第一，硅谷巨头陷落！

领跑全球榜单超两月，蚂蚁数科宣布数据智能体关键技术开源

Mistral重磅开源Devstral 2：123B编码神器+SWE-bench 72.2分，免费API+本地CLI炸裂来袭！

蚂蚁开源 LLaDA2.0，业内首个100B 参数规模的扩散语言模型

Meta开源神话崩塌：闭源新模型竟靠阿里Qwen训练，小扎“煲汤求才”换来战略大转向

Mistral 发布 Devstral2 开源编程模型：1230 亿参数，成本仅 Claude Sonnet 1/7

Mistral AI发布第二代开源编码模型:Devstral2性能超群，采用差异化许可策略

​全球科技巨头联合成立 AI 代理基金会，推动开源技术标准化

AI日报：蚂蚁推灵光网页版AI助手；智谱开源GLM-4.6V系列；谷歌Mixboard重磅升级

智谱重磅开源 AutoGLM:能点外卖、订机票的手机级 AI Agent 向所有人开放

智谱开源 GLM-4.6V 系列：106B 原生支持 Function Call，轻量版 9B 免费商用

微软开源实时语音模型VibeVoice-Realtime-0.5B，300ms实时开声，90分钟长音频都不喘！

AI日报：Kling 2.6将发布；千问APP推学习大模型；Z-Image-Turbo-Fun-Controlnet-Union 开源

vLLM-Omni开源:把扩散模型、ViT、LLM塞进一条流水线，多模态推理一次跑完

商汤NEO开源:用1/10数据量媲美顶级多模态模型，终结"拼凑式"AI时代

阿里通义实验室再出王炸!Z-Image-Turbo-Fun-Controlnet-Union 开源，6B 参数秒杀 Flux

推荐阅读

上云服务

微软开源 TRELLIS.2：一键将图片转为高精度 3D 模型

全球科技巨头联合成立 AI 代理基金会，推动开源技术标准化