LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-07-18 11:27:26 64人关注

AI 视频成本新高?Google Veo3通过 Gemini API 现已上线

谷歌的旗舰级视频生成模型 Veo3 现已通过 Gemini API 向开发者开放,提供文本转视频功能,并支持同步音频生成。此举标志着 AI 视频制作迈入新阶段,但也伴随着更高的成本。

谷歌视频生成模型 Veo3 视频生成 Gemini API 视频生成 AI 视频制作成本 文本转视频技术 同步音频生成技术

2025-06-28 09:14:11 55人关注

Suno 收购 WavTool,强化 AI 音乐编辑工具 amid 音乐版权争议

AI 音乐公司 Suno 在本周四宣布收购 WavTool,这是一款基于浏览器的 AI 数字音频工作站(DAW)。此举旨在增强 Suno 在歌曲创作和制作方面的编辑能力。WavTool 于2023年推出,提供多种功能,包括音频分离、AI 音频生成和 AI 音乐助手,预计将与 Suno 最新推出的编辑界面相结合。

AI音乐创作 Suno收购WavTool AI数字音频工作站 AI音频生成技术 AI音乐助手功能 Suno歌曲编辑界面

2025-05-13 10:38:39 151人关注

0.33秒生成1秒音频!Muyan-TTS 开源上线,播客、有声书场景完美适配

开源语音合成迎来新突破!近日发布的开源 TTS 模型 Muyan-TTS 专为播客、有声书、长视频等场景设计,具备零样本语音合成、极速生成与高连贯性朗读能力,是当前最适合批量化长语音生成的模型之一。

AI语音生成 Muyan TTS技术 音频生成技术 播客制作AI工具 TTS技术应用场景

2025-03-02 18:41:28 83人关注

超快音效生成模型TangoFlux:仅需3秒钟就能生成30秒长音频

在人工智能领域,文本音频生成技术正逐渐成为研究的热点。最近,研究者们推出了一款名为 TANGOFLUX 的全新模型,该模型在性能和效率上均表现出色。

超快音频生成 TangoFlux技术 音频生成技术 AI音频处理 实时音频合成

2025-02-05 08:10:30 159人关注

每日五分钟!谷歌 “Daily Listen”功能用 AI打造个性化播客

谷歌近日正在试验一项名为 “Daily Listen” 的新功能,该功能利用人工智能技术,为用户在 Discover 信息流中生成个性化的播客风格摘要。这项技术旨在为用户提供更为简洁和有趣的内容体验,帮助他们更快了解感兴趣的话题。

AI个性化播客 每日AI播客推荐 AI播客技术 个性化播客内容 AI音频生成技术

2025-01-20 05:42:40 74人关注

AI音频魔法师Resona V2A 可自动为视频配音效

在这个AI技术大行其道的时代,Resona V2A技术横空出世,它就像一位神奇的魔术师,能让视频自动开口,唱出属于自己的旋律。这不仅是技术的突破,更是创意者的福音。

AI音频技术 Resona V2A AI音频处理 AI音频工具 音频生成技术

2025-01-18 18:32:42 188人关注

阿里通义音频生成大模型 FunAudioLLM 开源 支持情绪语音对话、有声读物等场景

阿里通义实验室最近开源了名为FunAudioLLM的音频生成大模型项目,旨在提升人类与大型语言模型(LLMs)间的自然语音交互体验。该项目由两个核心模型组成:SenseVoice和CosyVoice。

通义FunAudioLLM 阿里语音大模型 音频生成技术 大模型语音合成 语音生成AI

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10