- 上云资讯 -
2025-05-06 16:38:17 44人关注
芝浦工大创新Vote-based框架,大幅提升手持物体姿态估计精度
在增强现实(AR)等应用中,手持物体的姿态估计是一项至关重要但颇具挑战性的任务。近期,日本芝浦工业大学的研究团队提出了一种基于 Vote 机制的多模态融合框架,显著提高了这一领域的准确性,令人瞩目地提升了13.9% 的姿态估计精度。
2025-01-27 01:15:29 159人关注
震撼登场!英伟达开源图像生成模型Sana ,1秒生图、支持中英文和emoji
近日,英伟达开源了一款名为 Sana 的图像生成模型,这一模型仅有0.6亿个参数,极大降低了运行门槛。
2024-12-18 21:29:22 42人关注
Roboflow完成4000万美元B轮融资,视觉AI开发平台引领行业变革
视觉AI开发平台Roboflow近日宣布完成4000万美元B轮融资。本轮融资由GV领投,Craft Ventures、Y Combinator以及Vercel AI创始人Guillermo Rauch、谷歌高管Jeff Dean和Replit创始人Amjad Masad等知名投资者参投。
2024-12-17 10:11:37 33人关注
零样本学习颠覆“分割一切”!SAMURAI 突破视频追踪瓶颈,实时锁定目标无压力!
Meta 推出的“分割一切”模型 SAM 在图像分割领域可谓是所向披靡,但一碰到视频物体追踪,它就有点力不从心了,尤其是在人山人海、目标快速移动或玩“躲猫猫”的场景下,SAM 就会犯迷糊。这是因为 SAM 模型的记忆机制就像个“固定窗口”,只顾着记录最近的画面,而忽略了记忆内容的质量,导致在视频中出现误差传播,追踪效果大打折扣。