上云资讯 - 来上云吧，企业上云一站式服务

2024-12-19 18:28:36 260人关注

微软发布 LLM2CLIP:新 AI 技术使语言模型助力图像理解

在当今科技领域，CLIP（Contrastive Language-Image Pre-training）是一个重要的多模态基础模型。它通过在大规模图像 - 文本对上使用对比学习损失，将视觉信号和文本信号结合到一个共享的特征空间中。