- 上云资讯 -
2025-06-01 10:41:16 18人关注
微软发布 Phi-4 多模态与迷你模型,语音视觉文本处理再升级
近日,微软进一步扩展了 Phi-4家族,推出了两款新模型:Phi-4多模态(Phi-4-multimodal)和 Phi-4迷你(Phi-4-mini),这两款模型的亮相,无疑将为各类 AI 应用提供更加强大的处理能力。
2025-05-27 10:22:14 46人关注
谷歌推出 LMEval:统一评估大语言与多模态模型的新工具
近日,谷歌宣布推出 LMEval,这是一个开源框架,旨在简化和标准化对大型语言和多模态模型的评估。该工具为研究人员和开发者提供了一个统一的评估流程,可以方便地对来自不同公司的 AI 模型进行比较,比如 GPT-4o、Claude3.7Sonnet、Gemini2.0Flash 和 Llama-3.1-405B 等。
2025-05-01 16:25:20 52人关注
阿里开源多模态模型Qwen2.5-Omni:显存大幅降低暴降 50%
在开源大模型的竞争中,阿里巴巴推出了其最新的多模态模型 Qwen2.5-Omni-3B。这款模型的显著特点是显存使用减少了50%,在同等处理能力下,更加适合普通消费者的 GPU 设备。这一创新标志着阿里在多模态人工智能领域的进一步突破。
2025-03-20 16:24:39 51人关注
谷歌开源新一代多模态模型 Gemma-3:性能卓越、成本降低 10 倍
谷歌 CEO 桑达尔・皮查伊(Sundar Pichai)在一场发布会上宣布,谷歌开源了最新的多模态大模型 Gemma-3,该模型以低成本、高性能为特点,备受关注。
2025-02-05 18:24:29 104人关注
前微软视觉专家胡瀚加盟腾讯,全面负责混元多模态大模型研发
前微软亚洲研究院视觉计算组的首席研究员胡瀚已正式加入腾讯,接替已离职的前腾讯混元大模型技术负责人刘威,承担起多模态大模型的研发任务。这一消息引起了业界的广泛关注。
2025-01-28 16:29:27 289人关注
DeepSeek深夜再放大招,发布全新多模态大模型Janus-Pro
国产大模型DeepSeek发布了全新的Janus-Pro多模态大模型,正式进军文生图领域。这一举动标志着DeepSeek在多模态AI技术上的重大突破。
2025-01-28 10:13:22 287人关注
Kimi 发布全新 SOTA 模型: k1.5 多模态思考模型登场
近日,北京月之暗面科技有限公司宣布其旗下智能助手 Kimi 迎来了重大技术升级,推出了全新的 k1.5多模态思考模型。这一模型在多模态推理和通用推理能力上达到了行业领先水平,标志着 Kimi 在人工智能领域的又一次突破性进展。
2025-01-27 09:40:40 159人关注
面壁智能推MiniCPM-o 2.6:一款适用于手机的多模态智能大模型
OpenBMB 团队近日推出了 MiniCPM-o2.6,这是该系列中最新、功能最强大的多模态大型语言模型(MLLM)。MiniCPM-o2.6的最大亮点在于它的8亿参数,使其在视觉、语音以及多模态直播领域的性能接近于 GPT-4o-202405,成为开源社区中多功能且高效的选择。
2025-01-27 05:39:43 121人关注
阶跃星辰与茶百道达成深度合作 门店已接入Step-1V多模态理解大模型
上海阶跃星辰智能科技有限公司与国内知名茶饮品牌茶百道于2025年1月14日宣布达成深度合作。
step stars tea baidao step1v 多模态模型 step stars tea 新品 baidao step1v 技术解析 多模态模型应用