- 上云资讯 -
2025-11-29 16:26:14 57人关注
腾讯混元开源 HunyuanOCR 模型:1B 参数斩获多项 SOTA,多场景赋能 OCR 应用
11月25日,腾讯混元正式宣布开源全新 OCR 模型 HunyuanOCR。该模型参数仅10亿(1B),依托混元原生多模态架构打造,在多项业界 OCR 应用榜单中斩获 SOTA(最先进水平)成绩,为 OCR 技术落地提供轻量化高效解决方案。
2025-11-29 16:12:27 60人关注
腾讯发布 HunyuanOCR 开源模型,参数仅 1B 成就多项 SOTA 表现
近日,腾讯正式推出其全新开源模型 HunyuanOCR,参数量仅为1B。该模型基于腾讯独创的混元多模态架构设计,已在多个行业标准的 OCR 应用中取得了 SOTA(最先进水平)的佳绩。腾讯方面表示,HunyuanOCR 的 “端到端” 设计理念使得模型的各项功能在一次前向推理中便可快速获得最优结果。
2025-11-22 09:31:11 121人关注
AI日报:腾讯元宝推视频模型HunyuanVideo1.5;谷歌Nano Banana Pro上线;夸克AI眼镜与高德合作加码
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
2025-11-21 18:28:44 95人关注
腾讯发布全新视频生成模型 HunyuanVideo1.5,降低视频创作门槛
今日,腾讯混元大模型团队正式发布了其最新视频生成模型 HunyuanVideo1.5,标志着视频生成技术的又一重要突破。这款基于 Diffusion Transformer(DiT)架构的轻量级模型,参数量达8.3B,能够生成5至10秒的高清晰度视频,已在腾讯的「元宝」平台上线,向用户开放体验。
2025-09-28 18:11:24 212人关注
腾讯发布并开源新一代生图模型“HunyuanImage3.0”
腾讯混元推出并开源其最新的多模态图像生成模型 ——“混元图像3.0”(HunyuanImage3.0)。此次发布标志着该模型的参数规模已达到80B,成为首个开源的工业级原生多模态生成模型。官方表示,该模型的生成效果可以与业内领先的闭源模型相媲美。
2025-09-17 15:32:40 153人关注
腾讯HunyuanImage 2.1强势登顶!开源2K文生图王者,秒变高清艺术大师?
近日,腾讯Hunyuan团队正式开源HunyuanImage2.1,这款17B参数的DiT(Diffusion Transformer)文生图模型迅速登顶Artificial Analysis Image Arena排行榜,超越HiDream-I1-Dev和Qwen-Image,成为开源权重模型的新领军者。
2025-09-11 12:25:43 1011人关注
腾讯开源HunyuanImage 2.1!2K高清神图秒生成,复杂提示精准控多主体,AI设计效率爆表?
腾讯混元团队近日正式开源HunyuanImage2.1,这一高效文本到图像生成模型,支持原生2K(2048×2048)分辨率图像输出,标志着开源AI在高分辨率创作领域的重大进步。该模型已在Hugging Face和GitHub平台全面开放,开发者可轻松集成使用。HunyuanImage2.1通过大规模数据集和多专家模型优化结构化描述,大幅提升文本-图像对齐能力,生成速度与1K图像相当,预计将加速AI在设计、广告和内容创作中的应用。
HunyuanImage2.1开源 文本到图像生成模型 2K分辨率AI图像生成 开源AI高分辨率创作 腾讯混元AI模型 文本-图像对齐优化
2025-09-03 14:22:27 228人关注
腾讯开源神器HunyuanWorld-Voyager:单图秒生3D世界,碾压Gen-3登顶全球!
腾讯AI研究团队Hunyuan近期动作频频,其最新开源项目HunyuanWorld-Voyager引发了全球AI与3D技术领域的热烈讨论。作为一款具备原生3D重建能力的超长程世界模型,HunyuanWorld-Voyager在WorldScore排行榜上荣登榜首,凭借卓越的相机控制、内容对齐和3D一致性表现,超越了Gen-3等竞品。这款模型为3D重建、深度估计及图生3D等应用场景带来了革命性突破。
HunyuanWorld-Voyager 腾讯AI 3D重建 原生3D重建能力 超长程世界模型 WorldScore排行榜 图生3D应用场景
2025-09-03 09:17:24 496人关注
腾讯混元翻译模型 Hunyuan-MT-7B 重磅开源,拿下国际比赛30项第一
近日,腾讯宣布其混元翻译模型 Hunyuan-MT-7B 正式开源,该模型在国际机器翻译比赛中表现出色,斩获30个第一名,展示了其强大的翻译能力。Hunyuan-MT-7B 是一个参数量仅为7亿的轻量级翻译模型,支持33种语言和5种民汉语言及方言的互译,具备全面的翻译能力。
腾讯混元翻译模型开源 Hunyuan-MT-7B 翻译模型 轻量级翻译模型 多语言翻译支持 机器翻译比赛冠军 民汉语言互译
2025-09-02 11:39:18 289人关注
腾讯开源翻译巨头 Hunyuan-MT-7B:斩获 WMT2025 三十项冠军,翻译界的新霸主!
近日,腾讯在 2025 年世界机器翻译大会(WMT2025)上表现惊艳,正式推出了他们的翻译大模型 ——Hunyuan-MT-7B。这个模型在比赛中获得了 30 个语种的第一名,成为同类产品中的佼佼者,彰显了其强大的翻译能力。
2025-08-28 16:32:32 371人关注
腾讯混元开源端到端视频音效生成模型HunyuanVideo-Foley
8月28日,腾讯混元宣布开源端到端视频音效生成模型HunyuanVideo-Foley,这一模型能够通过输入视频和文字为视频匹配电影级音效,为视频创作带来了新的突破。用户只需输入相应的文本描述,HunyuanVideo-Foley就能生成与画面精准匹配的音频,从而打破AI生成视频只能“看”不能“听”的局限,让无声AI视频成为历史。
腾讯混元开源视频音效模型 HunyuanVideo-Foley AI视频音效生成 电影级音效匹配 端到端视频音效生成 AI视频创作突破
2025-08-15 08:13:34 1540人关注
腾讯开源Hunyuan-GameCraft!单张图片秒变可玩游戏,RTX 4090轻松运行
腾讯近日宣布开源其最新研发的Hunyuan-GameCraft框架,这一创新工具能够从单张图像和用户操作信号中生成可交互的游戏视频,为游戏开发领域带来了颠覆性突破。
2025-08-14 18:37:39 5214人关注
一张图秒变游戏大片!腾讯混元开源Hunyuan-GameCraft
腾讯混元团队宣布推出一款创新工具Hunyuan-GameCraft,该工具基于HunyuanVideo底模,是一款高动态交互式游戏视频生成框架。Hunyuan-GameCraft的发布,标志着游戏视频生成领域的一大进步,它允许用户通过简单的输入——一张图、文字描述和动作指令,来生成高清动态游戏视频。
腾讯混元团队 Hunyuan-GameCraft 游戏视频生成框架 高动态交互式视频 HunyuanVideo底模 游戏视频生成工具
2025-07-12 10:28:45 289人关注
腾讯混元Hunyuan-A13B模型API上线
近日,腾讯云官网正式上线了腾讯混元A13B模型的API服务,输入价格定为每百万Tokens0.5元,输出价格则为每百万Tokens2元,这一举措迅速在开发者社区中引发了热烈反响。
2025-06-30 14:38:11 440人关注
腾讯开源 Hunyuan-A13B:小尺寸,大智慧的 AI 模型
Hunyuan-A13B 是一个由腾讯最新开源的大语言模型,它以创新的设计理念,在相对较小的活跃参数规模下,实现了强大的性能表现,特别适用于资源受限的环境。
