LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-06-05 10:42:25 108人关注

多模态大模型视觉推理能力评估:o3 仅得 25.8% 分数

近日,由清华大学、腾讯混元、斯坦福大学及卡耐基梅隆大学的研究团队联合发布了一项新评估基准 ——RBench-V,专门针对多模态大模型的视觉推理能力进行测试。该基准的推出,旨在填补当前评估体系中对模型视觉输出能力的空白,以便更全面地了解现有模型的性能。

多模态模型 视觉推理评分 多模态模型技术 视觉推理能力评估 多模态模型应用场景

2025-01-27 09:40:40 207人关注

面壁智能推MiniCPM-o 2.6:一款适用于手机的多模态智能大模型

OpenBMB 团队近日推出了 MiniCPM-o2.6,这是该系列中最新、功能最强大的多模态大型语言模型(MLLM)。MiniCPM-o2.6的最大亮点在于它的8亿参数,使其在视觉、语音以及多模态直播领域的性能接近于 GPT-4o-202405,成为开源社区中多功能且高效的选择。

多模态AI模型 Minicpm-O-26模型 AI大模型技术 多模态模型应用 AI模型新闻

2025-01-27 05:39:43 168人关注

阶跃星辰与茶百道达成深度合作 门店已接入Step-1V多模态理解大模型

上海阶跃星辰智能科技有限公司与国内知名茶饮品牌茶百道于2025年1月14日宣布达成深度合作。

step stars tea baidao step1v 多模态模型 step stars tea 新品 baidao step1v 技术解析 多模态模型应用

2025-01-19 07:44:29 125人关注

开源本地实时多模态模型Moshi:实时生成语音 支持多种口音

法国独立非盈利AI研究实验室 Kyutai 发布了一款语音助理 Moshi,这是一款革命性的实时本机多模态基础模型。这一创新模型在某些功能上模仿并超越了 OpenAI 在五月推出的 GPT-4o 所展示的一些功能。

开源多模态模型 Moshi模型 多模态AI技术 开源AI模型 多模态模型应用

2025-01-19 05:36:22 167人关注

阶跃星辰发布Step-2等三个模型 主打多模态能力

在AI的璀璨星河中,阶跃星辰公司以其创新的多模态模型,成为引人瞩目的新星。在WAIC盛会上,他们展示了三款独具匠心的AI模型,主打的多模态能力。

多模态模型 多模态大模型 多模态AI技术 多模态模型应用场景 多模态AI发展趋势

2025-01-18 23:11:37 96人关注

​支付宝发布多模态医疗大模型,多项识别准确率达 90% 以上

7月5日,在2024世界人工智能大会上,支付宝发布了国内首批多模态医疗大模型之一。

支付宝多模态医疗模型 医疗AI技术 多模态模型应用 支付宝AI医疗创新 医疗大模型技术

2025-01-08 07:28:37 99人关注

云知声推出山海多模态大模型:支持音色自由切换 视觉场景理解

中国人工智能领域的知名企业云知声,于2024年8月23日在北京宣布推出其最新研发成果——山海多模态大模型。

云知声 山海大模型 多模态大模型 AI大模型技术 多模态模型应用

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10