- 上云资讯 -
2025-08-07 18:35:18 119人关注
小红书发布开源多模态大模型 dots.vlm1,以 NaViT 视觉编码器领跑行业
小红书 Hi Lab 近日发布并开源了其首个自研多模态大模型 dots.vlm1。该模型基于12亿参数的 NaViT 视觉编码器 和 DeepSeek V3大语言模型,从零开始完全训练,其卓越性能在多模态视觉理解与推理能力上已接近当前领先的闭源模型,如 Gemini2.5Pro 和 Seed-VL1.5,标志着开源多模态模型的性能达到了新的高度。
小红书多模态大模型 dots.vlm1开源模型 NaViT视觉编码器 DeepSeek V3大语言模型 多模态视觉理解与推理 开源多模态模型性能
2025-07-07 12:16:21 149人关注
开源多模态大模型 EarthMind:革新地球观测数据分析的利器
近日,意大利特伦托大学、德国柏林工业大学及慕尼黑工业大学的研究团队联合推出了开源多模态大模型 EarthMind,该模型旨在高效分析和理解复杂的地球观测数据。这一创新的模型能够处理多粒度和多传感器的地球观测信息,为自然灾害监测和城市发展规划等领域提供了重要的决策依据。