LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-04-16 10:22:37 69人关注

3D视觉大模型SpatialLM开源,实时识别场景内容

在人工智能领域,3D视觉与空间理解技术正成为推动具身智能、自主导航及虚拟现实等应用的关键。2025年3月,杭州群核科技在GTC2025全球大会上宣布正式开源其自主研发的3D视觉大语言模型 SpatialLM,引发业界广泛关注。

3D视觉模型 SpatialLM 场景识别 3D视觉技术 空间语言模型

2025-01-28 04:29:42 61人关注

淘天推出创新对齐方法,解决视觉大模型中的幻觉问题

近年来,视觉大模型(Large Vision Language Models, LVLMs)在图像理解和跨模态任务中展现出非凡的能力,然而随之而来的 “幻觉现象” 问题也日益突出。为了应对这一挑战,淘天集团的未来生活实验室团队提出了一种名为 “令牌偏好优化”(Token Preference Optimization,简称 TPO)的新方法,并引入了一种自我校准的视觉锚定奖励机制。

Taotian创新对齐方法 视觉模型对齐技术 视觉模型创新方法 视觉模型对齐实践 Taotian视觉模型技术

2024-12-29 03:11:28 150人关注

百度智能云一见视觉大模型v4.5发布 具备七大核心优势

近日,百度智能云一见视觉大模型平台v4.5正式发布,该平台的升级,不仅为工业行业带来了革命性的变革,也为安全生产、餐饮连锁门店管理、工厂车间操作等多个领域提供了高效的视觉智能解决方案。

百度智能云 视觉大模型 V4.5版本发布 百度智能云视觉模型 视觉模型技术升级

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10