微信扫码
添加专属顾问
2025-01-18 20:23:19 152人关注
苹果和瑞士洛桑联邦理工学院的研究人员联合开源了一款名为4M-21的大规模多模态视觉模型。与其他专门针对特定任务或数据类型进行优化的模型不同,4M-21具有广泛的通用性和灵活性。尽管只有30亿参数,但它可以提供图像分类、目标检测、语义分割、实例分割、深度估计、表面法线估计等数十种功能。
苹果开源模型 多模态视觉模型 苹果开源技术 开源AI模型 苹果视觉AI