LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-07-31 17:45:27 38人关注

阿里WebShaper发布!GAIA碾压Claude 3.5 Sonnet、GPT-4o

阿里通义实验室(Tongyi Lab)近日重磅推出WebAgent系列的第四款开源工具——WebShaper,这一突破性框架以其创新的“形式化驱动”信息检索范式引发行业热议。据AIbase从社交媒体及相关渠道获悉,WebShaper不仅在GAIA基准测试中取得60.19的高分,超越了Claude3.5Sonnet和GPT-4o,还通过全新的数据生成方法显著提升了AI在复杂任务中的信息检索与推理能力。

阿里通义实验室 WebAgent系列开源工具 WebShaper框架 形式化驱动信息检索 GAIA基准测试高分 AI复杂任务推理能力

2025-04-15 16:32:27 143人关注

阿里通义实验室推出新型数字人生成模型,音视频合成更真实!

阿里通义实验室近日发布了一款名为 “OmniTalker” 的新型数字人视频生成大模型。这一创新模型的核心在于其能够通过上传一段参考视频,实现对视频中人物的表情、声音和说话风格的精准模仿。相较于传统的数字人制作流程,OmniTalker 显著降低了制作成本,同时提升了生成内容的真实感和互动体验,满足了广泛的应用需求。

数字人模型 通义实验室 AI数字人技术 数字人技术应用 通义实验室研究成果

2025-03-27 18:30:34 96人关注

阿里通义实验室开源音乐生成技术InspireMusic

近日,通义实验室正式开源了其创新性的音乐生成技术——InspireMusic。该技术旨在打造一个集音乐、歌曲及音频生成能力于一体的开源AIGC工具包,为研究者、开发者及音乐爱好者提供一个全面的创作平台。

阿里云通义实验室 通义实验室InspireMusic 阿里云AI音乐生成 AI音乐生成技术 通义实验室最新成果

2025-01-22 01:43:32 407人关注

阿里通义实验室语音生成大模型CosyVoice升级2.0版本

阿里巴巴通义实验室语音团队宣布,其开源的语音生成大模型CosyVoice已升级至2.0版本,这一升级标志着语音生成技术在准确性、稳定性和自然体验方面的显著进步。CosyVoice2.0通过采用离线和流式一体化建模的语音生成大模型技术,实现了双向流式语音合成,首包合成延迟可达到150ms,显著提升了语音合成的响应速度。

通义千问升级 CosyVoice-2 AI语音模型 语音技术升级 通义千问新功能

2024-12-11 11:10:43 174人关注

去除背景噪声 阿里通义实验室开源语音处理技术ClearerVoice-Studio

阿里巴巴达摩院的通义实验室近期宣布开源一项名为ClearerVoice-Studio的语音处理技术,旨在提升语音质量和可懂度。随着语音技术的广泛应用,语音质量受到越来越多人的关注,尤其是在环境噪声、混响和设备拾音等情况下,语音处理技术的需求日益迫切。

清除背景噪音 ClearerVoice Studio 音频降噪工具 背景噪音消除 语音清晰度提升

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10