2025-01-19 00:40:14
                        194人关注
                    
                    商汤科技发布“日日新5o”:对标GPT-4o 实现实时流式多模态交互
                    在2024年世界人工智能大会上,商汤科技发布了国内首个所见即所得模型“日日新5o”,这一模型的交互体验与GPT-4o相当,实现了实时的流式多模态交互。该模型通过整合声音、文本、图像和视频等跨模态信息,能够进行实时的理解和响应。例如,它能够识别工作人员佩戴的胸卡并判断出会场位置,描述小狗玩偶的外观和穿戴,以及对工作人员随手画的图画进行即时评价。
                    
                        
                        商汤科技
                        
                        日日新5.0
                        
                        实时多模态交互
                        
                        多模态AI技术
                        
                        AI交互系统