上云资讯 - 来上云吧，企业上云一站式服务

AI对话上云服务上云资讯解决方案关于我们

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-09-01 13:28:17 376人关注

腾讯ARC开源音频模型 AudioStory：用大语言模型生成长音频

近日，腾讯 ARC 团队发布了一款名为 AudioStory 的模型，旨在利用大语言模型（LLMs）生成长篇叙事音频。该模型解决了现有文本到音频生成技术在处理短音频方面的优势与长篇叙事音频在时间连贯性与组合推理上的挑战。

腾讯ARC团队AudioStory模型大语言模型生成长篇音频文本到音频生成技术长篇叙事音频时间连贯性音频生成组合推理挑战

2025-08-19 15:12:19 798人关注

腾讯AudioGenie横空出世！一键生成电影级音效，Claude与Gemini瑟瑟发抖！

随着人工智能技术的飞速发展，音频生成领域迎来了一位重量级选手——腾讯AI Lab推出的AudioGenie。这款创新的多模态音频生成工具以其自然贴切的生成效果、强大的上下文理解能力以及无需训练的特性，正在重塑全球AI音频市场格局。

腾讯AI Lab AudioGenie 多模态音频生成工具 AI音频生成音频生成技术 AI音频市场

2025-07-18 11:27:26 359人关注

AI 视频成本新高?Google Veo3通过 Gemini API 现已上线

谷歌的旗舰级视频生成模型 Veo3 现已通过 Gemini API 向开发者开放，提供文本转视频功能，并支持同步音频生成。此举标志着 AI 视频制作迈入新阶段，但也伴随着更高的成本。

谷歌视频生成模型 Veo3 视频生成 Gemini API 视频生成 AI 视频制作成本文本转视频技术同步音频生成技术

2025-06-28 09:14:11 204人关注

Suno 收购 WavTool，强化 AI 音乐编辑工具 amid 音乐版权争议

AI 音乐公司 Suno 在本周四宣布收购 WavTool，这是一款基于浏览器的 AI 数字音频工作站（DAW）。此举旨在增强 Suno 在歌曲创作和制作方面的编辑能力。WavTool 于2023年推出，提供多种功能，包括音频分离、AI 音频生成和 AI 音乐助手，预计将与 Suno 最新推出的编辑界面相结合。

AI音乐创作 Suno收购WavTool AI数字音频工作站 AI音频生成技术 AI音乐助手功能 Suno歌曲编辑界面

2025-05-13 10:38:39 518人关注

0.33秒生成1秒音频!Muyan-TTS 开源上线，播客、有声书场景完美适配

开源语音合成迎来新突破!近日发布的开源 TTS 模型 Muyan-TTS 专为播客、有声书、长视频等场景设计，具备零样本语音合成、极速生成与高连贯性朗读能力，是当前最适合批量化长语音生成的模型之一。

AI语音生成 Muyan TTS技术音频生成技术播客制作AI工具 TTS技术应用场景

2025-03-02 18:41:28 279人关注

超快音效生成模型TangoFlux：仅需3秒钟就能生成30秒长音频

在人工智能领域，文本音频生成技术正逐渐成为研究的热点。最近，研究者们推出了一款名为 TANGOFLUX 的全新模型，该模型在性能和效率上均表现出色。

超快音频生成 TangoFlux技术音频生成技术 AI音频处理实时音频合成

2025-02-05 08:10:30 577人关注

每日五分钟！谷歌 “Daily Listen”功能用 AI打造个性化播客

谷歌近日正在试验一项名为 “Daily Listen” 的新功能，该功能利用人工智能技术，为用户在 Discover 信息流中生成个性化的播客风格摘要。这项技术旨在为用户提供更为简洁和有趣的内容体验，帮助他们更快了解感兴趣的话题。

AI个性化播客每日AI播客推荐 AI播客技术个性化播客内容 AI音频生成技术

2025-01-20 05:42:40 278人关注

AI音频魔法师Resona V2A 可自动为视频配音效

在这个AI技术大行其道的时代，Resona V2A技术横空出世，它就像一位神奇的魔术师，能让视频自动开口，唱出属于自己的旋律。这不仅是技术的突破，更是创意者的福音。

AI音频技术 Resona V2A AI音频处理 AI音频工具音频生成技术

2025-01-18 18:32:42 544人关注

阿里通义音频生成大模型 FunAudioLLM 开源支持情绪语音对话、有声读物等场景

阿里通义实验室最近开源了名为FunAudioLLM的音频生成大模型项目，旨在提升人类与大型语言模型（LLMs）间的自然语音交互体验。该项目由两个核心模型组成:SenseVoice和CosyVoice。

通义FunAudioLLM 阿里语音大模型音频生成技术大模型语音合成语音生成AI

- 上云资讯 -

腾讯ARC开源音频模型 AudioStory：用大语言模型生成长音频

腾讯AudioGenie横空出世！一键生成电影级音效，Claude与Gemini瑟瑟发抖！

AI 视频成本新高?Google Veo3通过 Gemini API 现已上线

Suno 收购 WavTool，强化 AI 音乐编辑工具 amid 音乐版权争议

0.33秒生成1秒音频!Muyan-TTS 开源上线，播客、有声书场景完美适配

超快音效生成模型TangoFlux：仅需3秒钟就能生成30秒长音频

每日五分钟！谷歌 “Daily Listen”功能用 AI打造个性化播客

AI音频魔法师Resona V2A 可自动为视频配音效

阿里通义音频生成大模型 FunAudioLLM 开源支持情绪语音对话、有声读物等场景

推荐阅读

上云服务

- 上云资讯 -

​腾讯ARC开源音频模型 AudioStory：用大语言模型生成长音频

腾讯AudioGenie横空出世！一键生成电影级音效，Claude与Gemini瑟瑟发抖！

AI 视频成本新高?Google Veo3通过 Gemini API 现已上线

Suno 收购 WavTool，强化 AI 音乐编辑工具 amid 音乐版权争议

0.33秒生成1秒音频!Muyan-TTS 开源上线，播客、有声书场景完美适配

超快音效生成模型TangoFlux：仅需3秒钟就能生成30秒长音频

每日五分钟！谷歌 “Daily Listen”功能用 AI打造个性化播客

AI音频魔法师Resona V2A 可自动为视频配音效

阿里通义音频生成大模型 FunAudioLLM 开源 支持情绪语音对话、有声读物等场景

推荐阅读

上云服务

腾讯ARC开源音频模型 AudioStory：用大语言模型生成长音频

阿里通义音频生成大模型 FunAudioLLM 开源支持情绪语音对话、有声读物等场景