- 上云资讯 -
2025-01-18 00:16:13 93人关注
声音魔法师!FoleyCrafter让无声视频瞬间拥有逼真配音
FoleyCrafter 是一个基于文本的视频到音频生成框架,可以生成与输入视频在语义上相关且时间上同步的高质量音频。
2024-12-27 03:23:25 100人关注
NotebookLM推出2个新功能 AI音频摘要更智能,商业版蓄势待发
Google周四宣布对其AI笔记和研究助手NotebookLM进行重大升级,为用户带来更智能、更个性化的体验。这次更新主要聚焦于备受瞩目的音频概览功能,让用户能够更精准地引导AI生成的对话内容,聚焦特定主题,而不仅仅是生成全面的音频摘要。
2024-12-22 16:14:17 101人关注
全新开源音频模型Hertz-Dev:超低延迟,实现AI实时对话
在当今科技的浪潮中,对话式人工智能(AI)已经成为我们生活中的重要组成部分。然而,快速、高效和实时的互动仍然是一个不小的挑战。尤其是延迟问题,指的是输入与响应之间的时间差,常常让客服机器人和虚拟助手的体验变得缓慢,影响用户的使用感受。
2024-12-22 06:32:37 68人关注
Fish Audio发布Fish Agent V0.1 3B 实时语音克隆
近日,Fish Audio公司发布了全新的语音处理模型Fish Agent V0.13B,这款语音到语音模型能够高效、精确地生成和处理语音,尤其擅长模拟或克隆不同的声音。这意味着,我们距离拥有一个声音自然、反应迅速的AI语音助手又近了一步。