微信扫码
添加专属顾问
2024-12-19 18:28:36 73人关注
在当今科技领域,CLIP(Contrastive Language-Image Pre-training)是一个重要的多模态基础模型。它通过在大规模图像 - 文本对上使用对比学习损失,将视觉信号和文本信号结合到一个共享的特征空间中。
Microsoft LLM2Clip AI语言模型 图像识别技术 多模态AI AI语言与图像转换 大模型应用场景