上云资讯 - 来上云吧，企业上云一站式服务

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-12-03 11:13:45 627人关注

阿里通义实验室再出王炸!Z-Image-Turbo-Fun-Controlnet-Union 开源，6B 参数秒杀 Flux

2阿里巴巴通义实验室今日正式开源 Z-Image-Turbo-Fun-Controlnet-Union，这款全新 ControlNet 模型标志着其 Z-Image 系列图像生成生态的重大扩展。作为 AIbase 独家追踪的开源 AI 动态，此次发布进一步强化了 Z-Image-Turbo 在精确控制与创意生成方面的领先优势，迅速引发全球开发者与创作者的热议。

2025-07-31 17:45:27 318人关注

阿里WebShaper发布！GAIA碾压Claude 3.5 Sonnet、GPT-4o

阿里通义实验室（Tongyi Lab）近日重磅推出WebAgent系列的第四款开源工具——WebShaper，这一突破性框架以其创新的“形式化驱动”信息检索范式引发行业热议。据AIbase从社交媒体及相关渠道获悉，WebShaper不仅在GAIA基准测试中取得60.19的高分，超越了Claude3.5Sonnet和GPT-4o，还通过全新的数据生成方法显著提升了AI在复杂任务中的信息检索与推理能力。

阿里通义实验室 WebAgent系列开源工具 WebShaper框架形式化驱动信息检索 GAIA基准测试高分 AI复杂任务推理能力

2025-04-15 16:32:27 491人关注

阿里通义实验室推出新型数字人生成模型，音视频合成更真实！

阿里通义实验室近日发布了一款名为 “OmniTalker” 的新型数字人视频生成大模型。这一创新模型的核心在于其能够通过上传一段参考视频，实现对视频中人物的表情、声音和说话风格的精准模仿。相较于传统的数字人制作流程，OmniTalker 显著降低了制作成本，同时提升了生成内容的真实感和互动体验，满足了广泛的应用需求。

数字人模型通义实验室 AI数字人技术数字人技术应用通义实验室研究成果

2025-03-27 18:30:34 309人关注

阿里通义实验室开源音乐生成技术InspireMusic

近日，通义实验室正式开源了其创新性的音乐生成技术——InspireMusic。该技术旨在打造一个集音乐、歌曲及音频生成能力于一体的开源AIGC工具包，为研究者、开发者及音乐爱好者提供一个全面的创作平台。

阿里云通义实验室通义实验室InspireMusic 阿里云AI音乐生成 AI音乐生成技术通义实验室最新成果

2025-01-22 01:43:32 953人关注

阿里通义实验室语音生成大模型CosyVoice升级2.0版本

阿里巴巴通义实验室语音团队宣布，其开源的语音生成大模型CosyVoice已升级至2.0版本，这一升级标志着语音生成技术在准确性、稳定性和自然体验方面的显著进步。CosyVoice2.0通过采用离线和流式一体化建模的语音生成大模型技术，实现了双向流式语音合成，首包合成延迟可达到150ms，显著提升了语音合成的响应速度。

通义千问升级 CosyVoice-2 AI语音模型语音技术升级通义千问新功能

2024-12-11 11:10:43 523人关注

去除背景噪声阿里通义实验室开源语音处理技术ClearerVoice-Studio

阿里巴巴达摩院的通义实验室近期宣布开源一项名为ClearerVoice-Studio的语音处理技术，旨在提升语音质量和可懂度。随着语音技术的广泛应用，语音质量受到越来越多人的关注，尤其是在环境噪声、混响和设备拾音等情况下，语音处理技术的需求日益迫切。

清除背景噪音 ClearerVoice Studio 音频降噪工具背景噪音消除语音清晰度提升

- 上云资讯 -

阿里通义实验室再出王炸!Z-Image-Turbo-Fun-Controlnet-Union 开源，6B 参数秒杀 Flux

阿里WebShaper发布！GAIA碾压Claude 3.5 Sonnet、GPT-4o

阿里通义实验室推出新型数字人生成模型，音视频合成更真实！

阿里通义实验室开源音乐生成技术InspireMusic

阿里通义实验室语音生成大模型CosyVoice升级2.0版本

去除背景噪声阿里通义实验室开源语音处理技术ClearerVoice-Studio

推荐阅读

上云服务

- 上云资讯 -

阿里通义实验室再出王炸!Z-Image-Turbo-Fun-Controlnet-Union 开源，6B 参数秒杀 Flux

阿里WebShaper发布！GAIA碾压Claude 3.5 Sonnet、GPT-4o

阿里通义实验室推出新型数字人生成模型，音视频合成更真实！

阿里通义实验室开源音乐生成技术InspireMusic

阿里通义实验室语音生成大模型CosyVoice升级2.0版本

去除背景噪声 阿里通义实验室开源语音处理技术ClearerVoice-Studio

推荐阅读

上云服务

去除背景噪声阿里通义实验室开源语音处理技术ClearerVoice-Studio