- 上云资讯 -
阿里云云原生
阿里云开发者
腾讯云开发者
火山引擎开发者社区
魔搭ModelScope社区
微软科技
Azure云科技
Zilliz
OpenAI
Anthropic
Gemini
LangChain
Hugging Face
Mistral
2025-11-12 12:44:18 113人关注
全新开源语音模型 Maya1:实现实时、富有表现力的文本转语音
Maya Research 最近发布了 Maya1,这是一个具有30亿参数的文本转语音模型。它能够将文本和简短描述转化为可控、富有表现力的语音,并能在单个 GPU 上实时运行。Maya1的核心功能在于能够捕捉真实人类情感以及精确的声音设计。
2024-12-22 10:38:37 236人关注
新开源语音识别模型Moonshine:速度比OpenAI Whisper快五倍
美国初创公司 Useful Sensors 推出了一款名为 Moonshine 的开源语音识别模型。Moonshine 的设计旨在更高效地处理音频数据,相比于 OpenAI 的 Whisper,它在计算资源的使用上更为经济,处理速度快五倍。这一新模型专为在资源有限的硬件上实现实时应用而打造,具有灵活的架构。
