LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-01-20 10:37:37 66人关注

智源开源无标注视频学习3D生成模型See3D

北京智源人工智能研究院(BAAI)近日宣布推出一款创新的3D生成模型See3D,该模型能够利用大规模无标注的互联网视频进行学习。这一技术突破标志着向“See Video, Get3D”的理念迈进了重要一步。See3D模型不依赖于传统的相机参数,而是采用视觉条件技术,仅通过视频中的视觉线索生成相机方向可控且几何一致的多视角图像。这种方法避免了昂贵的3D或相机标注的需求,能够高效地从互联网视频中学习3D先验。

无监督视频学习 See3D 视频学习技术 无监督学习算法 视频分析模型

2024-12-17 10:11:37 88人关注

零样本学习颠覆“分割一切”!SAMURAI 突破视频追踪瓶颈,实时锁定目标无压力!

Meta 推出的“分割一切”模型 SAM 在图像分割领域可谓是所向披靡,但一碰到视频物体追踪,它就有点力不从心了,尤其是在人山人海、目标快速移动或玩“躲猫猫”的场景下,SAM 就会犯迷糊。这是因为 SAM 模型的记忆机制就像个“固定窗口”,只顾着记录最近的画面,而忽略了记忆内容的质量,导致在视频中出现误差传播,追踪效果大打折扣。

zero-shot learning 视频追踪 SAMURAI算法 无监督学习 计算机视觉技术

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10