- 上云资讯 -
2025-12-03 11:13:45 215人关注
阿里通义实验室再出王炸!Z-Image-Turbo-Fun-Controlnet-Union 开源,6B 参数秒杀 Flux
2阿里巴巴通义实验室今日正式开源 Z-Image-Turbo-Fun-Controlnet-Union,这款全新 ControlNet 模型标志着其 Z-Image 系列图像生成生态的重大扩展。作为 AIbase 独家追踪的开源 AI 动态,此次发布进一步强化了 Z-Image-Turbo 在精确控制与创意生成方面的领先优势,迅速引发全球开发者与创作者的热议。
2025-07-31 17:45:27 245人关注
阿里WebShaper发布!GAIA碾压Claude 3.5 Sonnet、GPT-4o
阿里通义实验室(Tongyi Lab)近日重磅推出WebAgent系列的第四款开源工具——WebShaper,这一突破性框架以其创新的“形式化驱动”信息检索范式引发行业热议。据AIbase从社交媒体及相关渠道获悉,WebShaper不仅在GAIA基准测试中取得60.19的高分,超越了Claude3.5Sonnet和GPT-4o,还通过全新的数据生成方法显著提升了AI在复杂任务中的信息检索与推理能力。
阿里通义实验室 WebAgent系列开源工具 WebShaper框架 形式化驱动信息检索 GAIA基准测试高分 AI复杂任务推理能力
2025-03-27 18:30:34 212人关注
阿里通义实验室开源音乐生成技术InspireMusic
近日,通义实验室正式开源了其创新性的音乐生成技术——InspireMusic。该技术旨在打造一个集音乐、歌曲及音频生成能力于一体的开源AIGC工具包,为研究者、开发者及音乐爱好者提供一个全面的创作平台。
2025-01-22 01:43:32 732人关注
阿里通义实验室语音生成大模型CosyVoice升级2.0版本
阿里巴巴通义实验室语音团队宣布,其开源的语音生成大模型CosyVoice已升级至2.0版本,这一升级标志着语音生成技术在准确性、稳定性和自然体验方面的显著进步。CosyVoice2.0通过采用离线和流式一体化建模的语音生成大模型技术,实现了双向流式语音合成,首包合成延迟可达到150ms,显著提升了语音合成的响应速度。
2024-12-11 11:10:43 404人关注
去除背景噪声 阿里通义实验室开源语音处理技术ClearerVoice-Studio
阿里巴巴达摩院的通义实验室近期宣布开源一项名为ClearerVoice-Studio的语音处理技术,旨在提升语音质量和可懂度。随着语音技术的广泛应用,语音质量受到越来越多人的关注,尤其是在环境噪声、混响和设备拾音等情况下,语音处理技术的需求日益迫切。
