微信扫码
添加专属顾问
2025-02-16 08:25:37 198人关注
最近,多模态大型语言模型(MLLM)取得了显著进展,特别是在视觉和文本模态的集成方面。但随着人机交互的日益普及,语音模态的重要性也日益凸显,尤其是在多模态对话系统中。语音不仅是信息传输的关键媒介,还能显著提高交互的自然性和便利性。
开源大模型 GPT4o VITA-15模型 多模态AI 语音视觉模型 开源AI技术
2025-01-09 01:25:19 697人关注
在2024年8月21日举办的火山引擎AI创新巡展上海站上,火山引擎展示了其豆包大模型的全面升级,以及对话式AI实时交互解决方案的增强。
字节跳动 豆包大模型 语音视觉模型升级 大模型技术更新 AI模型优化