LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-09-03 14:22:27 89人关注

腾讯开源神器HunyuanWorld-Voyager:单图秒生3D世界,碾压Gen-3登顶全球!

腾讯AI研究团队Hunyuan近期动作频频,其最新开源项目HunyuanWorld-Voyager引发了全球AI与3D技术领域的热烈讨论。作为一款具备原生3D重建能力的超长程世界模型,HunyuanWorld-Voyager在WorldScore排行榜上荣登榜首,凭借卓越的相机控制、内容对齐和3D一致性表现,超越了Gen-3等竞品。这款模型为3D重建、深度估计及图生3D等应用场景带来了革命性突破。

HunyuanWorld-Voyager 腾讯AI 3D重建 原生3D重建能力 超长程世界模型 WorldScore排行榜 图生3D应用场景

2025-09-03 13:21:19 68人关注

腾讯开源具备原生3D重建能力的超长程世界模型:HunyuanWorld-Voyager

近日,腾讯正式发布了HunyuanWorld-Voyager,这是一种创新的视频扩散框架,旨在通过单张输入图像生成具备世界一致性的3D 点云,支持用户按自定义的相机路径进行沉浸式探索。

腾讯HunyuanWorld-Voyager 视频扩散框架 3D点云生成 世界一致性3D建模 自定义相机路径 沉浸式探索技术

2025-09-03 08:38:38 142人关注

AI日报:腾讯开源3D世界模型HunyuanWorld-Voyager;即梦AI系列模型开放API;通义推智能体开发框架AgentScope 1.0

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

AI技术趋势 AI开发者指南 AI热点内容 创新AI产品应用 人工智能洞悉

2025-08-15 14:17:16 85人关注

智元机器人发布机器人世界模型开源平台——Genie Envisioner

智元机器人在上海宣布推出面向真实世界机器人操控的统一世界模型平台——Genie Envisioner(GE)。这一创新平台突破了传统机器人学习系统分阶段开发的模式,将未来帧预测、策略学习与仿真评估整合进以视频生成为核心的闭环架构,实现了机器人从“看”到“想”再到“动”的端到端推理与执行。基于约3000小时的真实机器人操控视频数据,GE在跨平台泛化和长时序任务执行上展现出显著优势,为具身智能发展开辟了从视觉理解到动作执行的全新技术路径。

智元机器人 Genie Envisioner 平台 具身智能技术 机器人端到端推理 机器人视觉理解 机器人动作执行

2025-08-07 09:36:26 64人关注

AI日报:百度推全球首批AI数字员工;Claude Opus4.1出世;谷歌DeepMind发布世界模型Genie 3

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

AI日报 AI技术趋势 AI开发者指南 AI热点内容 创新AI产品应用 人工智能世界探索

2025-07-28 17:19:39 138人关注

腾讯混元3D世界模型震撼发布!360°沉浸场景免费体验,AI重塑虚拟世界未来!

近日,腾讯在2025世界人工智能大会上正式发布混元3D世界模型1.0,并宣布全面开源,成为业界首个支持沉浸式漫游、交互与仿真的3D世界生成模型。这款模型以其高精度360°场景生成和可交互漫游功能,迅速引发行业热议,为游戏开发、虚拟现实(VR)、数字内容创作等领域打开了无限可能。

腾讯混元3D世界模型 3D世界生成模型 沉浸式漫游技术 高精度360°场景生成 VR交互仿真技术 数字内容创作工具

2025-07-28 09:22:41 379人关注

腾讯混元3D世界模型正式发布并开源

在2025年7月27日举办的2025世界人工智能大会腾讯论坛上,腾讯公司正式发布了混元3D世界模型1.0版本,并宣布该模型将全面开源。这一举措标志着业界首个支持沉浸漫游、交互与仿真的开源世界生成模型诞生,为游戏开发、虚拟现实(VR)及数字内容创作等领域开辟了全新的可能性。

混元3D世界模型1.0 开源世界生成模型 沉浸漫游与交互仿真 游戏开发AI技术 VR内容创作工具 数字内容生成AI

2025-07-28 08:39:41 130人关注

腾讯全面展示AI时代产品应用图,发力3D世界模型与具身智能平台Tairos

在2025世界人工智能大会腾讯论坛上,腾讯重磅发布混元3D世界模型、具身智能平台Tairos(钛螺丝)等AI最新技术成果,并带来智能体开发平台等产品的全面升级,首次完整展示面向AI时代的产品应用全景图。

腾讯混元3D世界模型 具身智能平台Tairos AI智能体开发平台 2025世界人工智能大会 腾讯AI技术全景图 AI时代产品应用

2025-07-26 14:15:14 70人关注

​南洋理工与北大合作推出开源长记忆世界模型WORLDMEM,提升虚拟场景一致性

近日,南洋理工大学、北京大学王选计算机技术研究所与上海人工智能实验室的研究人员联合开源了名为 “WORLDMEM” 的长记忆世界模型。这一新模型旨在解决当前虚拟环境中长期一致性的问题,尤其是在视角变化或时间推移的情况下,仍能维持3D 空间的连贯性,从而显著提升用户体验。

AI

2025-06-24 08:32:28 156人关注

阿里云推出自动驾驶模型加速框架PAI-TurboX 训练时间可缩短50%

近日,阿里云正式发布面向自动驾驶领域模型的训练、推理加速框架——PAI-TurboX,旨在提升感知、规划控制乃至世界模型的训推效率。该框架在多个行业模型的训练任务中展现出了显著优势,可缩短高达50%的时间。

阿里云PAI-TurboX 自动驾驶模型训练加速 自动驾驶模型推理加速 PAI-TurboX框架优势 自动驾驶世界模型训练

2025-04-13 18:31:45 136人关注

昆仑万维发布Matrix-Zero世界模型 支持3D场景、可交互视频生成

2025年2月14日,昆仑万维集团正式推出Matrix-Zero世界模型,标志着中国在空间智能领域迈出了重要一步。Matrix-Zero包含两款子模型:3D场景生成大模型和可交互视频生成大模型,旨在通过AI技术重塑数字内容创作模式,推动影视制作、游戏开发、具身智能等行业的创新发展。

昆仑矩阵 3D互动视频 Zero 3D交互技术 昆仑矩阵技术解析 3D视频交互应用

2025-02-15 16:15:40 189人关注

昆仑万维发布Matrix-Zero世界模型:国内首创3D场景与可交互视频生成

昆仑万维今日宣布正式推出其Matrix-Zero世界模型,成为国内首家同时具备3D场景生成和可交互视频生成能力的人工智能企业,标志着其在空间智能领域迈出了重要一步。

昆仑万维 Matrix-Zero 世界模型 3D场景生成 可交互视频生成 国内首创

2025-02-12 12:41:44 191人关注

英伟达推出首个生成式世界基础模型Cosmos,加速物理AI系统的发展

在2025年消费电子展(CES)上,NVIDIA 发布了全新的 Cosmos 平台,该平台旨在加速物理人工智能(AI)系统的开发,尤其是自主驾驶车辆和机器人。Cosmos 平台集成了生成式世界基础模型(WFM)、视频标记器、安全防护机制以及一个加速的数据处理管道,这些功能帮助开发者在减少对真实世界数据依赖的情况下创建和优化 AI 模型。

NVIDIA Cosmos 生成式世界模型 AI大模型 AI技术原理 生成式AI应用

2025-02-11 18:20:29 117人关注

Tim Brooks 跳槽 DeepMind,欲打造新一代世界模型团队

在 AI 领域,人才流动向来是激烈的竞争场所。最近,Tim Brooks 的跳槽事件引发了广泛关注。他在 Sora 工作仅三个月后,宣布转投竞争对手 Google DeepMind。此举被认为是由于 Sora 技术面临严重挑战,特别是在生成速度和性能上,与行业中的其他对手相比表现不佳。

Tim Brooks DeepMind World Model团队 AI研究团队 深度学习模型

2025-01-16 09:17:16 89人关注

RWKV 开源基金会开源 RWKV-6-World 14B 模型

2024年7月19日,RWKV开源基金会宣布全球开源了RWKV-6-World14B模型,这是目前最强的稠密纯RNN大语言模型。该模型在最新的性能测试中表现优异,英文性能与Llama213B相当,并且在多语言性能上显著领先,支持全球100多种语言和代码。

RWKV-6 世界模型 14B模型 RWKV-6技术解析 大语言模型架构

2025-01-02 13:17:34 320人关注

机器人训练新助手:挪威初创公司1X Technologies用虚拟世界模型为机器人 “打基础”

挪威的初创公司1X Technologies 最近宣称,他们在为机器人开发基于人工智能的世界模型方面取得了重大进展。简单来说,这些模型就像是机器人的虚拟试验场,能够让机器在各种情境中进行测试和改进,完全不需要真刀真枪的实地测试。

1x Technologies 机器人训练 虚拟世界模型 AI机器人训练方法 虚拟环境模拟训练 机器人学习技术

2025-01-02 11:45:26 196人关注

机器人公司1X推出世界模型 让机器人轻松完成叠衣服、端盘子等家务

机器人初创公司1X Technologies 开发了一种新的生成模型,可以提高仿真中训练机器人系统的效率。该公司在一篇新的博客文章中宣布了该模型,解决了机器人技术的重要挑战之一,即学习“世界模型(1X World Model)”,该模型可以预测世界如何响应机器人的动作而变化。

机器人世界模型 家庭任务自动化 1x Robotics应用场景 机器人技术进展 家庭服务机器人

2024-12-27 10:38:27 198人关注

Meta AI负责人:世界模型是实现“人类级AI”的关键,但可能还需要10年时间

如今的人工智能模型是否真的能像人类一样记忆、思考、计划和推理呢?有些 AI 实验室似乎让人觉得我们离 “人类级 AI” 不远了,但 Meta 的首席 AI 科学家 Yann LeCun 却给了大家一记冷水。他认为,我们要想实现这一目标,可能还需要十年的努力,而这一切的关键在于 “世界模型”。

Meta AI 世界模型 人类级AI AI技术突破 AI发展前沿

2024-12-26 16:13:14 136人关注

重新定义多模态AI!智源发布原生多模态世界模型Emu3

北京智源人工智能研究院宣布推出原生多模态世界模型Emu3。这一模型基于下一个token预测技术,无需依赖扩散模型或组合方法,就能够完成文本、图像、视频三种模态数据的理解和生成。Emu3在图像生成、视频生成、视觉语言理解等任务中超过了现有的知名开源模型,如SDXL、LLaVA、OpenSora等,展现了卓越的性能。

多模态AI 智源Emu3 AI大模型 多模态技术 AI技术前沿 人工智能创新

2024-12-26 14:18:20 98人关注

智源发布原生多模态世界模型Emu3:仅靠下一个token预测实现文本、图像和视频理解和生成

智源研究院正式发布了他们的新一代多模态世界模型 Emu3,该模型的最大亮点在于,它仅依靠下一个 token 的预测能力,就能在文本、图像和视频这三种不同模态中进行理解和生成。

多模态世界模型 Emu3 Token预测 大模型技术 AI多模态技术 Emu3应用场景

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10