AI日报：腾讯发布混元3D 3.0模型；昆仑万维上线Agent Studio功能；阿里Qoder推出付费订阅服务

作者：AIbase基地更新时间：2025-09-17 09:27:31 共327人关注

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://app.aibase.com/zh

1、腾讯重磅发布混元3D 3.0模型建模精度提升3倍

腾讯在2025全球数字生态大会上重磅发布混元3D 3.0模型，其3D-DiT分级雕刻技术显著提升了建模精度，同时推出混元3D Studio平台和开源计划，推动3D创作的边界拓展。

【AiBase提要:】

🧠 混元3D 3.0模型采用3D-DiT分级雕刻技术，建模精度提升3倍。

🎨 混元3D Studio平台提供专业创作工具，提升3D艺术创作效率和质量。

🚀 腾讯计划开源混元3D omni模型，加速3D生成技术在学术与工业应用中的落地。

2、昆仑万维AI 音乐创作平台Mureka上线Agent Studio功能，让音乐创作变得触手可及！

Mureka 的「Agent Studio」功能通过直观的方式让音乐创作变得触手可及，用户只需简单描述想法，AI 就能自动生成歌词和音乐。该功能包含多个创作场景，如专辑制作、热点写歌等，为用户提供多样化的音乐体验。

【AiBase提要:】

🎧 Mureka 推出「Agent Studio」功能，让普通人也能轻松进行音乐创作。

🤖 用户只需说出简单想法，AI 即可生成完整的歌词和音乐。

🎶 目前已有六个创作场景，涵盖专辑制作、热点写歌、情感表达等多种功能。

3、阿里Qoder推出付费订阅服务，Pro版每月20美元，助力AI自主编程

Qoder正式推出付费订阅计划，提供Pro和Pro+版本，支持无限代码补全、高级模型调用等功能，提升开发效率。同时优化了Credits消耗问题，提高智能体工具的并行化能力和工程检索准确率。

【AiBase提要:】

🔥 Qoder推出付费订阅服务，支持Pro和Pro+版本，满足开发者高效编程需求。

💡 Pro版提供无限代码补全和2000 Credits，Pro+版则提供6000 Credits和更多资源。

🚀 优化Credits消耗，提升智能体工具的并行化能力，降低token消耗。

4、VEED Fabric 1.0发布！一张图片变身“会说话”视频

VEED推出的Fabric 1.0是一款革命性的AI视频生成工具，能够通过一张图片和语音输入生成高质量的会说话视频。该工具在唇形同步、面部表情自然度以及生成速度方面表现出色，显著降低了视频制作的成本和时间，适用于多种内容创作场景。

【AiBase提要:】

🖼️ Fabric 1.0支持从静态图像生成生动的会说话视频，实现动态叙事。

⏱️ 视频生成速度提升7倍，成本降低60倍，适合快速内容生产。

🌐 集成多语言支持与自动字幕功能，增强全球用户使用体验。

详情链接:https://www.veed.io/ai/fabric-1-0

5、OpenAI重磅推出GPT-5-Codex：AI编码代理将彻底颠覆开发者世界

OpenAI发布GPT-5-Codex，标志着AI在代理式编码领域的重大突破，其动态思考机制和多平台集成能力显著提升了软件开发效率。

【AiBase提要:】

🧠 GPT-5-Codex具备动态思考机制，能根据任务复杂度调整处理时间，提升编码效率。

💻 支持多平台集成，包括IDE扩展、Web界面和GitHub代码审查功能，增强开发者生态。

🚀 开发者反馈显示，GPT-5-Codex显著缩短开发周期，提升代码生成速度并减少错误注释。

详情链接:https://openai.com/index/introducing-upgrades-to-codex/

6、全国发布《人工智能安全治理框架》2.0版，推动安全可信的 AI 生态建设

《人工智能安全治理框架》2.0版于2025年9月15日正式发布，旨在应对快速发展的AI技术带来的新挑战。该框架在1.0版基础上进行了优化，结合实际应用情况，完善了风险分类和防范措施，并强调了全球合作的重要性。

【AiBase提要:】

🔐 《人工智能安全治理框架》2.0版正式发布，以应对AI技术发展带来的新挑战。

🔍 框架基于1.0版进行优化，完善了风险分类与防范措施。

🤝 强调全球合作，推动多边机制下的人工智能安全治理合作。

详情链接:https://www.cac.gov.cn/2025-09/15/c_1759653448369123.htm

7、OpenAI Evals新增原生音频输入和评估功能

OpenAI 的 Evals 工具新增原生音频输入和评估功能，使开发者能够直接上传音频文件进行性能评估，从而大幅提升语音识别与生成模型的开发效率和准确性。

【AiBase提要:】

🎧 原生音频输入功能简化了评估流程，提升开发效率。

🔍 无需文本转录即可直接评估语音识别与生成模型性能。

💡 新功能为智能语音助手和音频内容生成提供更精准的测试支持。

8、颠覆传统！Mini-o3 开源模型实现超长视觉推理，深度思考不再是难题

Mini-o3是字节跳动与香港大学联合推出的开源视觉推理模型，能够进行数十轮的视觉推理，显著提升了处理复杂视觉问题的能力。其核心设计包括VisualProbe数据集、迭代数据收集流程和超轮次掩码策略，为多轮视觉推理技术提供了新的方向。

【AiBase提要:】

🧠 Mini-o3实现了数十轮的视觉推理能力，突破了以往1-2轮对话的限制。

📊 通过构建VisualProbe数据集和迭代数据收集流程，提升了模型的深度推理能力。

🔄 超轮次掩码策略优化了训练效率，使模型在测试阶段表现更出色。

详情链接:https://arxiv.org/pdf/2509.07969

9、上海AI Lab推出Lumina-DiMOO，开创多模态生成与理解新局面

上海人工智能实验室联合多所高校推出了新一代多模态生成与理解模型Lumina-DiMOO。该模型采用创新的全离散扩散架构，通过对比学习技术实现文本、图像和音频等数据的有效整合与对齐，显著提升了生成质量和效率，并在多种应用场景中展现出广阔的应用潜力。

【AiBase提要:】

🌟 Lumina-DiMOO 是新一代多模态生成模型，采用创新的“全离散扩散架构”以提升数据处理效率。

🛠️ 该模型通过对比学习技术，实现了文本、图像等多种数据的有效对齐与理解。

🚀 Lumina-DiMOO 在图像生成和理解方面表现卓越，能够适应多种应用场景，展现出广阔的应用潜力。

详情链接:https://github.com/Alpha-VLLM/Lumina-DiMOO

10、腾讯全新AI绘画升级！微调技术让生成图像美感提升300%

腾讯推出的微调技术显著提升了AI生成图像的真实感与美学评分，其创新方法包括“Direct-Align”和“语义相对偏好优化”，有效解决了奖励作弊和离线调整限制的问题。

【AiBase提要:】

🧠 通过“Direct-Align”技术减少梯度爆炸，提升模型优化能力。

🎨 “语义相对偏好优化”（SRPO）实现文本控制图像风格调整。

📈 实验显示SRPO训练模型在真实感和美学质量上显著提升。

详情链接:https://arxiv.org/pdf/2509.06942

11、Meta AI 发布 MobileLLM-R1：轻量级边缘推理模型，参数不足 10 亿，性能提升显著

Meta AI 推出的 MobileLLM-R1 系列模型在轻量化和边缘计算领域表现出色，其参数规模从140M到950M，专注于数学、编码和科学推理。该模型在训练效率和性能上均优于同类模型，尤其在数学和编码任务中表现突出。

【AiBase提要:】

🧩 新模型发布：Meta AI 推出 MobileLLM-R1 系列轻量级边缘推理模型，参数范围从140M 到950M。

📊 训练效率：MobileLLM-R1 仅用约11.7% 的数据训练，表现出色，训练成本和资源需求显著降低。

💡 性能优势：在多项基准测试中，MobileLLM-R1-950M 表现超越多款大型开源模型，尤其在数学和编码任务上。

详情链接:https://huggingface.co/facebook/MobileLLM-R1-950M

12、腾讯启动AI应用繁荣计划，超300家企业抢滩智能体新赛道

腾讯全球数字生态大会发布AI应用繁荣计划，聚焦垂直场景，推动AI产业深度渗透。该计划涵盖AI共创营和AI百校行，吸引超300家企业参与，并通过技术共享、资源开放等方式孵化智能体与大模型应用。

【AiBase提要:】

🌐腾讯人工智能应用繁荣计划旨在将人工智能深度融入垂直场景，有两个核心模块：人工智能共创营和人工智能百所学校活动。

🌐首届线下活动吸引了来自多个行业的近 3000 名参与者，显示了大规模人工智能应用的强劲市场需求。

🌐腾讯提供技术支持、资源和内容，帮助合作伙伴将其人工智能解决方案商业化。

13、谷歌DeepMind 发布 VaultGemma 具备差分隐私能力

谷歌 DeepMind 推出的 VaultGemma 是一款具有差分隐私能力的语言模型，专注于保护用户数据隐私。它基于 Gemma2 架构，采用了多查询注意力机制，并通过添加随机噪声确保模型输出无法与特定训练样本关联。尽管性能略显保守，但 VaultGemma 在隐私保护方面提供了更强的保障，未来有望为用户提供更安全和可靠的使用体验。

【AiBase提要:】

🔒 VaultGemma 是一款具备差分隐私能力的开源语言模型，参数规模达到10亿。

🧠 采用仅解码器的 Transformer 设计，序列长度限制为1024个 Token。

🌐 谷歌将在 Hugging Face 和 Kaggle 上公开 VaultGemma 及其代码库，推动隐私安全与开源技术的结合。

14、QuestMobile 数据：豆包月活超越DeepSeek，荣登中国原生 AI APP 榜首

QuestMobile发布的2025年8月AI应用行业月度报告显示，豆包凭借6.6%的环比增速达到1.57亿月活用户，超越DeepSeek成为原生应用的第一。腾讯元宝同样表现不俗，其月活增速高达22.4%，位居原生应用第三。此外，超过一半的TOP50 AI 应用为In-App插件应用，豆包作为一款PC客户端应用也成功跻身榜单，显示出其跨端使用的优势。

【AiBase提要:】

📱 豆包以6.6%的环比增速达到1.57亿月活用户，超越DeepSeek成为原生应用第一

💻 腾讯元宝月活增速达22.4%，位列原生应用第三，用户规模在1000万到1亿之间

🔄 超过一半的TOP50 AI 应用为In-App插件应用，豆包作为PC客户端成功跻身榜单

AI日报：腾讯发布混元3D 3.0模型；昆仑万维上线Agent Studio功能；阿里Qoder推出付费订阅服务

推荐阅读

上云服务