- 上云资讯 -
2025-01-27 12:13:41 189人关注
月之暗面Kimi多模态图片理解模型 API 发布
2025年1月15日,北京月之暗面科技有限公司宣布全新多模态图片理解模型moonshot-v1-vision-preview正式发布,该模型完善了moonshot-v1模型系列的多模态能力,助力Kimi更好地理解世界。
2025-01-24 10:40:20 148人关注
阿里发布多模态推理模型QVQ-72B!视觉、语言能力双提升,复杂问题迎刃而解
阿里巴巴近日推出了一款名为QVQ-72B的全新多模态推理模型,该模型基于Qwen2-VL-72B构建,融合了强大的语言和视觉能力,能够处理更为复杂的推理和分析任务,标志着阿里巴巴在多模态AI领域取得了新的突破。
2025-01-23 19:42:40 64人关注
多模态大模型引爆应用场景 阶跃星辰完成数亿美元融资
据智能涌现消息,中国大模型独角兽阶跃星辰近日完成数亿美元B轮融资,核心投资方包括上海国有资本投资有限公司及旗下基金,腾讯投资、五源资本、启明创投等战略和财务投资人也参与其中。这笔资金将主要用于基础模型研发,进一步提升多模态和复杂推理能力,并拓展C端应用场景。
2025-01-18 19:19:24 126人关注
新颖多模态推荐系统范式DiffMM,让扩散模型也能推荐短视频!
港大与腾讯的研究人员提出了一种全新的多模态推荐系统范式 ——DiffMM,旨在提高短视频推荐的精准度。该系统通过创建一个包含用户和视频信息的图,并利用图扩散和对比学习技术,更好地理解用户和视频之间的关系,从而实现更准确的推荐。
2024-12-29 17:35:19 65人关注
科大讯飞:将于10月24日发布多模态视觉交互技术
今日,科大讯飞宣布,2024科大讯飞全球1024开发者节将于10月24日开幕。
2024-12-25 01:41:41 41人关注
Salesforce AI研究推全新多模态模型BLIP-3-Video:低成本搞定视频理解
最近,Salesforce AI 研究团队推出了一款全新的多模态语言模型 ——BLIP-3-Video。随着视频内容的快速增加,如何高效处理视频数据成为了一个亟待解决的问题。这款模型的出现,旨在提升视频理解的效率和效果,适用于从自动驾驶到娱乐等各个行业。
Salesforce BLIP-3 多模态模型 视频理解 AI多模态技术 Salesforce AI模型 BLIP-3应用场景