- 上云资讯 -
2025-03-27 18:30:34 42人关注
阿里通义实验室开源音乐生成技术InspireMusic
近日,通义实验室正式开源了其创新性的音乐生成技术——InspireMusic。该技术旨在打造一个集音乐、歌曲及音频生成能力于一体的开源AIGC工具包,为研究者、开发者及音乐爱好者提供一个全面的创作平台。
2025-01-22 01:43:32 300人关注
阿里通义实验室语音生成大模型CosyVoice升级2.0版本
阿里巴巴通义实验室语音团队宣布,其开源的语音生成大模型CosyVoice已升级至2.0版本,这一升级标志着语音生成技术在准确性、稳定性和自然体验方面的显著进步。CosyVoice2.0通过采用离线和流式一体化建模的语音生成大模型技术,实现了双向流式语音合成,首包合成延迟可达到150ms,显著提升了语音合成的响应速度。
2024-12-11 11:10:43 110人关注
去除背景噪声 阿里通义实验室开源语音处理技术ClearerVoice-Studio
阿里巴巴达摩院的通义实验室近期宣布开源一项名为ClearerVoice-Studio的语音处理技术,旨在提升语音质量和可懂度。随着语音技术的广泛应用,语音质量受到越来越多人的关注,尤其是在环境噪声、混响和设备拾音等情况下,语音处理技术的需求日益迫切。