LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-02-16 10:24:39 101人关注

GPT-4o 级别!VITA-1.5:实时视觉与语音交互, 1.5秒互动延迟

近日,VITA-MLLM 团队宣布推出 VITA-1.5,这是该团队在 VITA-1.0基础上推出的升级版本,致力于提升多模态交互的实时性与准确性。VITA-1.5不仅支持英语和中文,还在多项性能指标上实现了显著提升,为用户提供了更流畅的交互体验。

GPT-4o VITA 1.5 实时视觉语音交互 多模态AI技术 AI语音交互技术 GPT-4o应用场景

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10