- 上云资讯 -
阿里云云原生
阿里云开发者
腾讯云开发者
火山引擎开发者社区
魔搭ModelScope社区
微软科技
Azure云科技
Zilliz
OpenAI
Anthropic
Gemini
LangChain
Hugging Face
Mistral
2025-01-18 00:16:13 93人关注
声音魔法师!FoleyCrafter让无声视频瞬间拥有逼真配音
FoleyCrafter 是一个基于文本的视频到音频生成框架,可以生成与输入视频在语义上相关且时间上同步的高质量音频。
2024-12-27 03:23:25 100人关注
NotebookLM推出2个新功能 AI音频摘要更智能,商业版蓄势待发
Google周四宣布对其AI笔记和研究助手NotebookLM进行重大升级,为用户带来更智能、更个性化的体验。这次更新主要聚焦于备受瞩目的音频概览功能,让用户能够更精准地引导AI生成的对话内容,聚焦特定主题,而不仅仅是生成全面的音频摘要。
2024-12-22 16:14:17 101人关注
全新开源音频模型Hertz-Dev:超低延迟,实现AI实时对话
在当今科技的浪潮中,对话式人工智能(AI)已经成为我们生活中的重要组成部分。然而,快速、高效和实时的互动仍然是一个不小的挑战。尤其是延迟问题,指的是输入与响应之间的时间差,常常让客服机器人和虚拟助手的体验变得缓慢,影响用户的使用感受。