上云资讯 - 来上云吧，企业上云一站式服务

2025-11-29 16:26:14 142人关注

腾讯混元开源 HunyuanOCR 模型:1B 参数斩获多项 SOTA，多场景赋能 OCR 应用

11月25日，腾讯混元正式宣布开源全新 OCR 模型 HunyuanOCR。该模型参数仅10亿（1B），依托混元原生多模态架构打造，在多项业界 OCR 应用榜单中斩获 SOTA(最先进水平)成绩，为 OCR 技术落地提供轻量化高效解决方案。

AI

2025-11-29 16:12:27 155人关注

腾讯发布 HunyuanOCR 开源模型，参数仅 1B 成就多项 SOTA 表现

近日，腾讯正式推出其全新开源模型 HunyuanOCR，参数量仅为1B。该模型基于腾讯独创的混元多模态架构设计，已在多个行业标准的 OCR 应用中取得了 SOTA（最先进水平）的佳绩。腾讯方面表示，HunyuanOCR 的 “端到端” 设计理念使得模型的各项功能在一次前向推理中便可快速获得最优结果。

AI

2025-11-22 09:31:11 357人关注

AI日报：腾讯元宝推视频模型HunyuanVideo1.5；谷歌Nano Banana Pro上线；夸克AI眼镜与高德合作加码

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

AI

2025-11-21 18:28:44 184人关注

腾讯发布全新视频生成模型 HunyuanVideo1.5，降低视频创作门槛

今日，腾讯混元大模型团队正式发布了其最新视频生成模型 HunyuanVideo1.5，标志着视频生成技术的又一重要突破。这款基于 Diffusion Transformer（DiT）架构的轻量级模型，参数量达8.3B，能够生成5至10秒的高清晰度视频，已在腾讯的「元宝」平台上线，向用户开放体验。

AI

2025-09-28 18:11:24 304人关注

腾讯发布并开源新一代生图模型“HunyuanImage3.0”

腾讯混元推出并开源其最新的多模态图像生成模型 ——“混元图像3.0”（HunyuanImage3.0）。此次发布标志着该模型的参数规模已达到80B，成为首个开源的工业级原生多模态生成模型。官方表示，该模型的生成效果可以与业内领先的闭源模型相媲美。

AI

2025-09-17 15:32:40 211人关注

腾讯HunyuanImage 2.1强势登顶！开源2K文生图王者，秒变高清艺术大师？

近日，腾讯Hunyuan团队正式开源HunyuanImage2.1，这款17B参数的DiT（Diffusion Transformer）文生图模型迅速登顶Artificial Analysis Image Arena排行榜，超越HiDream-I1-Dev和Qwen-Image，成为开源权重模型的新领军者。

AI

2025-09-11 12:25:43 1117人关注

腾讯开源HunyuanImage 2.1！2K高清神图秒生成，复杂提示精准控多主体，AI设计效率爆表？

腾讯混元团队近日正式开源HunyuanImage2.1，这一高效文本到图像生成模型，支持原生2K（2048×2048）分辨率图像输出，标志着开源AI在高分辨率创作领域的重大进步。该模型已在Hugging Face和GitHub平台全面开放，开发者可轻松集成使用。HunyuanImage2.1通过大规模数据集和多专家模型优化结构化描述，大幅提升文本-图像对齐能力，生成速度与1K图像相当，预计将加速AI在设计、广告和内容创作中的应用。

HunyuanImage2.1开源文本到图像生成模型 2K分辨率AI图像生成开源AI高分辨率创作腾讯混元AI模型文本-图像对齐优化

2025-09-03 14:22:27 330人关注

腾讯开源神器HunyuanWorld-Voyager：单图秒生3D世界，碾压Gen-3登顶全球！

腾讯AI研究团队Hunyuan近期动作频频，其最新开源项目HunyuanWorld-Voyager引发了全球AI与3D技术领域的热烈讨论。作为一款具备原生3D重建能力的超长程世界模型，HunyuanWorld-Voyager在WorldScore排行榜上荣登榜首，凭借卓越的相机控制、内容对齐和3D一致性表现，超越了Gen-3等竞品。这款模型为3D重建、深度估计及图生3D等应用场景带来了革命性突破。

HunyuanWorld-Voyager 腾讯AI 3D重建原生3D重建能力超长程世界模型 WorldScore排行榜图生3D应用场景

2025-09-03 13:21:19 340人关注

腾讯开源具备原生3D重建能力的超长程世界模型：HunyuanWorld-Voyager

近日，腾讯正式发布了HunyuanWorld-Voyager，这是一种创新的视频扩散框架，旨在通过单张输入图像生成具备世界一致性的3D 点云，支持用户按自定义的相机路径进行沉浸式探索。

腾讯HunyuanWorld-Voyager 视频扩散框架 3D点云生成世界一致性3D建模自定义相机路径沉浸式探索技术

2025-09-03 09:17:24 638人关注

腾讯混元翻译模型 Hunyuan-MT-7B 重磅开源，拿下国际比赛30项第一

近日，腾讯宣布其混元翻译模型 Hunyuan-MT-7B 正式开源，该模型在国际机器翻译比赛中表现出色，斩获30个第一名，展示了其强大的翻译能力。Hunyuan-MT-7B 是一个参数量仅为7亿的轻量级翻译模型，支持33种语言和5种民汉语言及方言的互译，具备全面的翻译能力。

腾讯混元翻译模型开源 Hunyuan-MT-7B 翻译模型轻量级翻译模型多语言翻译支持机器翻译比赛冠军民汉语言互译

2025-09-03 08:38:38 442人关注

AI日报：腾讯开源3D世界模型HunyuanWorld-Voyager；即梦AI系列模型开放API；通义推智能体开发框架AgentScope 1.0

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

AI技术趋势 AI开发者指南 AI热点内容创新AI产品应用人工智能洞悉

2025-09-02 11:39:18 406人关注

腾讯开源翻译巨头 Hunyuan-MT-7B：斩获 WMT2025 三十项冠军，翻译界的新霸主！

近日，腾讯在 2025 年世界机器翻译大会（WMT2025）上表现惊艳，正式推出了他们的翻译大模型 ——Hunyuan-MT-7B。这个模型在比赛中获得了 30 个语种的第一名，成为同类产品中的佼佼者，彰显了其强大的翻译能力。

腾讯翻译大模型腾讯Hunyuan-MT-7B WMT2025 机器翻译比赛多语种翻译模型机器翻译大模型技术

2025-08-28 16:32:32 525人关注

腾讯混元开源端到端视频音效生成模型HunyuanVideo-Foley

8月28日，腾讯混元宣布开源端到端视频音效生成模型HunyuanVideo-Foley，这一模型能够通过输入视频和文字为视频匹配电影级音效，为视频创作带来了新的突破。用户只需输入相应的文本描述，HunyuanVideo-Foley就能生成与画面精准匹配的音频，从而打破AI生成视频只能“看”不能“听”的局限，让无声AI视频成为历史。

腾讯混元开源视频音效模型 HunyuanVideo-Foley AI视频音效生成电影级音效匹配端到端视频音效生成 AI视频创作突破

2025-08-15 08:18:37 603人关注

AI日报：腾讯混元开源Hunyuan-GameCraft；最强图像编辑器nano-banana发布；字节开源Agent专用模型 M3-Agent-Control

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

AI日报 AI技术趋势 AI热点内容 AI开发者指南 AI产品应用人工智能创新

2025-08-15 08:13:34 1616人关注

腾讯开源Hunyuan-GameCraft！单张图片秒变可玩游戏，RTX 4090轻松运行

腾讯近日宣布开源其最新研发的Hunyuan-GameCraft框架，这一创新工具能够从单张图像和用户操作信号中生成可交互的游戏视频，为游戏开发领域带来了颠覆性突破。

腾讯开源游戏AI框架 Hunyuan-GameCraft技术解析游戏视频生成技术 AI游戏开发工具图像交互游戏生成

2025-08-14 18:37:39 5325人关注

一张图秒变游戏大片！腾讯混元开源Hunyuan-GameCraft

腾讯混元团队宣布推出一款创新工具Hunyuan-GameCraft，该工具基于HunyuanVideo底模，是一款高动态交互式游戏视频生成框架。Hunyuan-GameCraft的发布，标志着游戏视频生成领域的一大进步，它允许用户通过简单的输入——一张图、文字描述和动作指令，来生成高清动态游戏视频。

腾讯混元团队 Hunyuan-GameCraft 游戏视频生成框架高动态交互式视频 HunyuanVideo底模游戏视频生成工具

2025-07-12 10:28:45 434人关注

腾讯混元Hunyuan-A13B模型API上线

近日，腾讯云官网正式上线了腾讯混元A13B模型的API服务，输入价格定为每百万Tokens0.5元，输出价格则为每百万Tokens2元，这一举措迅速在开发者社区中引发了热烈反响。

腾讯混元A13B模型API 腾讯云AI模型价格腾讯混元A13B模型定价 AI大模型API服务开发者社区热议AI模型

2025-07-09 08:38:45 599人关注

AI日报：腾讯混元推3D生成大模型Hunyuan3D-PolyGen；钉钉AI表格重磅来袭；阿里推多模态大语言模型HumanOmniV2

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

AI日报 AI技术趋势 AI开发者指南人工智能热点创新AI产品应用 AI领域洞悉

2025-06-30 14:38:11 530人关注

腾讯开源 Hunyuan-A13B:小尺寸，大智慧的 AI 模型

Hunyuan-A13B 是一个由腾讯最新开源的大语言模型，它以创新的设计理念，在相对较小的活跃参数规模下，实现了强大的性能表现，特别适用于资源受限的环境。

腾讯开源大模型 Hunyuan-A13B 性能优势大语言模型设计理念资源受限环境 AI 模型腾讯 AI 开源项目

2025-06-05 16:20:14 589人关注

腾讯混元开源语音数字人模型HunyuanVideo-Avatar:图+音频，让图中的主角说话唱。

腾讯发布了一款创新技术 ——HunyuanVideo-Avatar 语音数字人模型，并将其开源。这一技术能够仅凭一张图片和一段音频，生成自然、真实的数字人说话或唱歌视频，标志着短视频创作进入了全新阶段。

腾讯混元视频虚拟人语音合成虚拟人唱歌 AI虚拟人技术腾讯AI大模型应用

- 上云资讯 -

腾讯混元开源 HunyuanOCR 模型:1B 参数斩获多项 SOTA，多场景赋能 OCR 应用

腾讯发布 HunyuanOCR 开源模型，参数仅 1B 成就多项 SOTA 表现

AI日报：腾讯元宝推视频模型HunyuanVideo1.5；谷歌Nano Banana Pro上线；夸克AI眼镜与高德合作加码

腾讯发布全新视频生成模型 HunyuanVideo1.5，降低视频创作门槛

腾讯发布并开源新一代生图模型“HunyuanImage3.0”

腾讯HunyuanImage 2.1强势登顶！开源2K文生图王者，秒变高清艺术大师？

腾讯开源HunyuanImage 2.1！2K高清神图秒生成，复杂提示精准控多主体，AI设计效率爆表？

腾讯开源神器HunyuanWorld-Voyager：单图秒生3D世界，碾压Gen-3登顶全球！

腾讯开源具备原生3D重建能力的超长程世界模型：HunyuanWorld-Voyager

腾讯混元翻译模型 Hunyuan-MT-7B 重磅开源，拿下国际比赛30项第一

AI日报：腾讯开源3D世界模型HunyuanWorld-Voyager；即梦AI系列模型开放API；通义推智能体开发框架AgentScope 1.0

腾讯开源翻译巨头 Hunyuan-MT-7B：斩获 WMT2025 三十项冠军，翻译界的新霸主！

腾讯混元开源端到端视频音效生成模型HunyuanVideo-Foley

AI日报：腾讯混元开源Hunyuan-GameCraft；最强图像编辑器nano-banana发布；字节开源Agent专用模型 M3-Agent-Control

腾讯开源Hunyuan-GameCraft！单张图片秒变可玩游戏，RTX 4090轻松运行

一张图秒变游戏大片！腾讯混元开源Hunyuan-GameCraft

腾讯混元Hunyuan-A13B模型API上线

AI日报：腾讯混元推3D生成大模型Hunyuan3D-PolyGen；钉钉AI表格重磅来袭；阿里推多模态大语言模型HumanOmniV2

腾讯开源 Hunyuan-A13B:小尺寸，大智慧的 AI 模型

腾讯混元开源语音数字人模型HunyuanVideo-Avatar:图+音频，让图中的主角说话唱。

推荐阅读

上云服务

- 上云资讯 -

腾讯混元开源 HunyuanOCR 模型:1B 参数斩获多项 SOTA，多场景赋能 OCR 应用

腾讯发布 HunyuanOCR 开源模型，参数仅 1B 成就多项 SOTA 表现

AI日报：腾讯元宝推视频模型HunyuanVideo1.5；谷歌Nano Banana Pro上线；夸克AI眼镜与高德合作加码

腾讯发布全新视频生成模型 HunyuanVideo1.5，降低视频创作门槛

腾讯发布并开源新一代生图模型“HunyuanImage3.0”

腾讯HunyuanImage 2.1强势登顶！开源2K文生图王者，秒变高清艺术大师？

腾讯开源HunyuanImage 2.1！2K高清神图秒生成，复杂提示精准控多主体，AI设计效率爆表？

腾讯开源神器HunyuanWorld-Voyager：单图秒生3D世界，碾压Gen-3登顶全球！

腾讯开源具备原生3D重建能力的超长程世界模型：HunyuanWorld-Voyager

​腾讯混元翻译模型 Hunyuan-MT-7B 重磅开源，拿下国际比赛30项第一

AI日报：腾讯开源3D世界模型HunyuanWorld-Voyager；即梦AI系列模型开放API；通义推智能体开发框架AgentScope 1.0

腾讯开源翻译巨头 Hunyuan-MT-7B：斩获 WMT2025 三十项冠军，翻译界的新霸主！

腾讯混元开源端到端视频音效生成模型HunyuanVideo-Foley

AI日报：腾讯混元开源Hunyuan-GameCraft；最强图像编辑器nano-banana发布；字节开源Agent专用模型 M3-Agent-Control

腾讯开源Hunyuan-GameCraft！单张图片秒变可玩游戏，RTX 4090轻松运行

一张图秒变游戏大片！腾讯混元开源Hunyuan-GameCraft

腾讯混元Hunyuan-A13B模型API上线

AI日报：腾讯混元推3D生成大模型Hunyuan3D-PolyGen；钉钉AI表格重磅来袭；阿里推多模态大语言模型HumanOmniV2

腾讯开源 Hunyuan-A13B:小尺寸，大智慧的 AI 模型

腾讯混元开源语音数字人模型HunyuanVideo-Avatar:图+音频，让图中的主角说话唱。

推荐阅读

上云服务

腾讯混元翻译模型 Hunyuan-MT-7B 重磅开源，拿下国际比赛30项第一