LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云 火山引擎 通义大模型 DeepSeek AI 大模型 人工智能 MCP 智能体

2025-01-21 08:37:38 93人关注

AI音频新技术MMAudio:输入视频或文本可自动给视频配音效

近日,来自伊利诺伊大学厄巴纳 - 香槟分校、Sony AI 及 Sony 集团公司的研究团队推出了一项名为 MMAudio 的新技术,该技术旨在通过多模态联合训练,实现高质量的视频到音频合成。

AI音频技术 MM音频技术 AI音频创新 音频新技术 AI音频应用场景

2024-12-17 13:21:36 64人关注

Meta最新音频大模型SPIRIT LM,让AI不止能说会道,还能“声情并茂”!

Meta AI近日重磅开源了名为SPIRIT LM的基础多模态语言模型,该模型能够自由混合文本和语音,为音频和文本的多模态任务打开了新的可能性。

Meta音频模型 Spirit LM 音频大模型技术 Meta AI音频创新 Spirit LM应用场景

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10