LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-07-24 08:36:42 49人关注

昆仑万维推出音乐模型Mureka V7、音频模型Mureka TTS V1

7月23日,昆仑万维集团为全球用户带来了两款创新的AI模型——Mureka V7音乐模型与Mureka TTS V1音频模型,这两款模型的发布标志着AI音乐生成领域迈出了重要一步。Mureka V7音乐模型自发布以来便备受瞩目,其以高效的音乐创作能力和卓越的音乐品质赢得了广泛好评。

昆仑万维AI模型 Mureka V7音乐模型 Mureka TTS V1音频模型 AI音乐生成技术 AI音乐创作能力

2025-07-17 09:44:46 245人关注

AI日报:字节将发布AI编程工具TRAE2.0版本;Mistral重磅推出音频模型Voxtral;月之暗面回应Kimi K2 API速度慢

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

AI日报 AI技术趋势 AI开发者指南 人工智能热点 创新AI产品应用 AI领域动态

2025-07-16 12:30:25 92人关注

Mistral重磅推出Voxtral:开源AI音频模型的新时代来临!

随着人工智能技术的飞速发展,语音正迅速成为我们与机器沟通的主要方式。法国初创企业 Mistral 近日正式发布了其首个开源音频模型 ——Voxtral,旨在打破大型企业封闭系统的垄断,为开发者提供一个更灵活且经济的替代方案。

开源语音模型 Mistral Voxtral 语音AI技术 语音模型开源方案 开发者语音工具 经济型语音AI

2025-05-10 16:14:28 76人关注

Vidu Q1 系列 API 正式开放 同时上线文生音频模型

近日, Vidu Q1系列 API 已正式面向全球开放。开发者与企业用户可借此契机,通过调用 API 体验 Vidu Q1模型所具备的多样化功能。

Vidu Q1 API 文本转音频API Vidu API发布 文本转音频技术 Vidu Q1新功能

2025-01-21 22:11:29 347人关注

阶跃星辰Step-1o Audio千亿参数端到端语音大模型上线 将接入跃问App

阶跃星辰近日宣布推出Step系列模型矩阵的新成员——Step-1o端到端语音大模型,据称这是国内首个千亿参数端到端语音大模型。这一新模型的发布标志着语音技术领域的一大进步,它通过端到端的语音方案,能够实现语音理解和生成的一体化,从而提升模型智商和情商的上限,并实现超自然、高质量的交流体验。

音频模型 语音模型 Step 1O模型 语音识别技术 音频处理技术

2025-01-16 23:16:43 219人关注

Qwen2-Audio:千问系列的音频多模态模型 无需文字即可语音交互

阿里云最新发布了一名为 Qwen-Audio 的大规模音频语言型,该模型可接受多种音频信号输入,够进行音频分析或直接回答语音指令极大地提升了语音交互体验。

Qwen2音频模型 多模态语音交互 大模型语音技术 AI语音交互系统 Qwen2应用场景

2025-01-16 00:35:39 120人关注

Stability AI开源音频生成模型Stable Audio Open:可生成47秒的立体声音频

最近,Stability AI 团队推出了一款全新的开源音频生成模型,名为 Stable Audio Open。这款模型的特别之处在于,它能够从文本提示生成时长可达47秒的立体声音频,采样率高达44.1kHz。

Stability AI Stable Audio AI音频生成 AI音频技术 Stability AI新闻 音频模型开源

2025-01-11 10:11:16 277人关注

阿里巴巴发布新语音模型 Qwen2-Audio,实力超越 OpenAI Whisper

近日,阿里巴巴在其 Qwen-Audio 的基础上,推出了全新的开源语音模型 Qwen2-Audio。这款模型不仅在语音识别、翻译和音频分析方面表现出色,更是在功能和性能上实现了显著提升。Qwen2-Audio 提供了基础版和指令微调版,用户可以通过语音对音频模型提问,并识别和分析内容。

阿里巴巴语音模型 Qwen2音频模型 阿里巴巴AI语音技术 Qwen2音频技术 阿里巴巴新语音模型发布

2025-01-08 06:40:38 117人关注

摩尔线程宣布开源音频理解大模型MooER

摩尔线程近日宣布开源其音频理解大模型MooER(摩耳),成为业界首个基于国产全功能GPU训练和推理的大型开源语音模型。MooER不仅支持中英文语音识别,还具备中译英的语音翻译能力,展现了强大的多语言处理能力。

摩尔线程开源音频理解模型 开源音频理解模型 摩尔线程开源模型 音频理解模型技术 开源AI音频模型

2025-01-02 21:21:33 121人关注

腾讯出品!AI音频模型 EzAudio AI,让文本秒变逼真声音

近日,约翰霍普金斯大学与腾讯 AI 实验室联合推出了一款名为 EzAudio 的新型文本到音频生成模型。这项技术承诺以空前的效率和高品质文本转换为声音,标志着人工智能和音频技术的重大飞跃。

腾讯EZAUDIO AI语音合成 文本转语音技术 AI语音生成 腾讯AI语音技术

2024-12-22 16:14:17 101人关注

全新开源音频模型Hertz-Dev:超低延迟,实现AI实时对话

在当今科技的浪潮中,对话式人工智能(AI)已经成为我们生活中的重要组成部分。然而,快速、高效和实时的互动仍然是一个不小的挑战。尤其是延迟问题,指的是输入与响应之间的时间差,常常让客服机器人和虚拟助手的体验变得缓慢,影响用户的使用感受。

开源音频模型 实时AI对话 超低延迟AI Hertz Dev 技术 AI音频处理技术

2024-12-22 05:38:40 62人关注

首个会话音频开源模型Hertz-dev 120毫秒超低延迟惊艳全网

一个革命性的开源音频模型——Hertz-dev横空出世,凭借其惊人的性能指标,让全球开发者为之震撼。这款拥有85亿参数的AI语音巨兽,通过2000万小时高质量音频数据的训练,成功实现了人类梦寐以求的全双工实时对话。

音频开源模型 Hertz Dev 开源音频模型 音频模型技术 音频AI开发

2024-12-17 13:21:36 95人关注

Meta最新音频大模型SPIRIT LM,让AI不止能说会道,还能“声情并茂”!

Meta AI近日重磅开源了名为SPIRIT LM的基础多模态语言模型,该模型能够自由混合文本和语音,为音频和文本的多模态任务打开了新的可能性。

Meta音频模型 Spirit LM 音频大模型技术 Meta AI音频创新 Spirit LM应用场景

2024-12-16 16:10:31 91人关注

英伟达出品!AI音频模型Fugatto:输入文本、音频可生成音乐、音效

在音乐和声音创作领域,技术与创意的结合总是面临诸多挑战。现有的 AI 模型往往只擅长特定的任务,缺乏广泛的适应性,这使得 AI 在音乐制作中的辅助作用受限。为了让 AI 更好地服务于音乐与音频生产,亟需一款能够灵活应对各种创作需求的通用模型。为此,NVIDIA 推出了 Fugatto,这是一款拥有25亿参数的音频生成与处理模型。

NVIDIA Fugatto AI音频模型 AI音频技术 音频模型应用 深度学习音频处理 NVIDIA AI技术

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10