- 上云资讯 -
2025-06-01 16:41:15 37人关注
云从科技的多模态大模型获全球认可,登顶 OpenCompass 榜单
近日,云从科技自主研发的多模态大模型 “从容 V2.0” 在全球知名的 OpenCompass 多模态榜单上以高达80.7分的优异成绩脱颖而出,荣登榜首。这一成就标志着中国在人工智能领域的进一步突破,尤其是在视觉感知、认知理解和跨领域应用等专业领域的表现令人瞩目。
2025-02-28 16:24:12 106人关注
百度文心大模型4.5将于3月16日发布 具备原生多模态、深度思考等能力
百度公司宣布,其最新的文心大模型4.5将于3月16日正式上线。据悉,文心大模型是百度在人工智能领域的重要布局,自两年前首次发布以来,已在全球范围内产生了深远影响。
2025-02-27 16:40:30 52人关注
百度文心4.5或将在3月中旬发布 提升推理及多模态能力
路透社消息,百度公司正紧锣密鼓筹备其下一代人工智能模型的发布,预计将于3月中旬正式推出文心4.5版本。据内部知情人士透露,新版本将在推理等多个核心领域实现显著能力提升,标志着百度在AI技术上的又一重要突破。
2025-02-21 12:39:26 202人关注
ScreenSpot-Pro:专为高分辨率环境设计的多模态 LLM 基准工具!
在专业环境中,图形用户界面(GUI)代理面临着三大关键挑战。首先,专业应用程序的复杂性远高于一般软件,要求对复杂布局有深入理解;其次,专业工具通常具备更高的分辨率,导致目标尺寸较小,从而降低了定位准确性;最后,工作流程往往依赖于额外工具和文档,增加了操作的复杂性。这些挑战凸显了开发更先进的基准和解决方案以提升 GUI 代理在这些严苛场景中的性能的必要性。
高分辨率多模态LLM基准 ScreenSpot Pro评测 多模态大模型基准测试 ScreenSpot Pro应用场景 高分辨率多模态基准
2025-02-05 18:24:29 104人关注
前微软视觉专家胡瀚加盟腾讯,全面负责混元多模态大模型研发
前微软亚洲研究院视觉计算组的首席研究员胡瀚已正式加入腾讯,接替已离职的前腾讯混元大模型技术负责人刘威,承担起多模态大模型的研发任务。这一消息引起了业界的广泛关注。
2025-01-28 16:29:27 289人关注
DeepSeek深夜再放大招,发布全新多模态大模型Janus-Pro
国产大模型DeepSeek发布了全新的Janus-Pro多模态大模型,正式进军文生图领域。这一举动标志着DeepSeek在多模态AI技术上的重大突破。
2025-01-27 08:30:43 84人关注
阿里巴巴达摩院推出电商场景多模态大模型Valley 2
阿里巴巴达摩院近日推出了一款名为Valley2的多模态大型语言模型,该模型基于电商场景设计,旨在通过可扩展的视觉-语言架构,提升各领域性能并拓展电商与短视频场景的应用边界。Valley2采用了Qwen2.5作为LLM主干,搭配SigLIP-384视觉编码器,结合MLP层和卷积进行高效特征转换。其创新之处在于引入了大视觉词汇、卷积适配器(ConvAdapter)和Eagle模块,增强了处理多样化真实世界输入的灵活性及训练推理效率。
2025-01-23 19:42:40 62人关注
多模态大模型引爆应用场景 阶跃星辰完成数亿美元融资
据智能涌现消息,中国大模型独角兽阶跃星辰近日完成数亿美元B轮融资,核心投资方包括上海国有资本投资有限公司及旗下基金,腾讯投资、五源资本、启明创投等战略和财务投资人也参与其中。这笔资金将主要用于基础模型研发,进一步提升多模态和复杂推理能力,并拓展C端应用场景。
2025-01-19 05:35:33 109人关注
网易伏羲发布机器人品牌“灵动” 推出“易生诸相”多模态大模型
在2024年世界人工智能大会(WAIC2024)上,网易伏羲揭开了其首个机器人品牌“灵动”的神秘面纱。
2025-01-16 23:20:18 65人关注
智源研究院推出新一代无编码器视觉语言多模态大模型EVE
近期,多模态大模型的研究和应用取得了显著进展。国外公司如OpenAI、Google、Microsoft等推出了一系列先进的模型,国内也有智谱AI、阶跃星辰等机构在该领域取得了突破。这些模型通常依赖视觉编码器来提取视觉特征并与大语言模型结合,但存在训练分离导致的视觉归纳偏置问题,限制了多模态大模型的部署效率和性能。
2025-01-13 19:27:46 80人关注
书生·浦语灵笔多模态大模型升级2.5版本 支持更长上下文 图像视频理解力直指GPT4V
最近,书生·浦语灵笔(InternLM-XComposer)多模态大模型升级2.5版本,这款由上海人工智能实验室领衔研发的模型,以其卓越的长上下文输入和输出能力,为文本图像理解和创作应用带来了革命性的突破。
2025-01-13 11:34:35 63人关注
百度推出飞桨多模态大模型开发套件 PaddleMIX 2.0版本
PaddleMIX2.0是由百度推出的多模态大模型开发套件,它整合了图文音视频等多模态数据,全面覆盖了自动驾驶、智慧医疗、搜索引擎等多个应用场景,推动了AI应用的创新。PaddleMIX2.0的发布,旨在降低多模态领域开发者的开发难度,提供高性能算法、便捷开发、高效训练和完备部署的支持。