2025-01-19 00:40:14
142人关注
商汤科技发布“日日新5o”:对标GPT-4o 实现实时流式多模态交互
在2024年世界人工智能大会上,商汤科技发布了国内首个所见即所得模型“日日新5o”,这一模型的交互体验与GPT-4o相当,实现了实时的流式多模态交互。该模型通过整合声音、文本、图像和视频等跨模态信息,能够进行实时的理解和响应。例如,它能够识别工作人员佩戴的胸卡并判断出会场位置,描述小狗玩偶的外观和穿戴,以及对工作人员随手画的图画进行即时评价。
商汤科技
日日新5.0
实时多模态交互
多模态AI技术
AI交互系统