- 上云资讯 -
2025-04-23 10:12:42 74人关注
谷歌 Gemini 推出视频分析功能,能准确识别视频拍摄场所
近日,科技媒体 Android Authority 报道称,谷歌最新的 Gemini 聊天机器人引入了一项引人注目的新功能 —— 视频分析。用户现在可以轻松上传视频并提问,Gemini 会基于视频内容进行智能分析,回答相关问题。这一创新功能无疑为视频内容的处理带来了新的可能性,吸引了广大用户的关注。
2025-02-11 08:35:45 93人关注
英伟达推出视频分析AI代理蓝图,助力工业与体育领域变革
标在2025年国际消费电子展(CES)开幕式上,英伟达首席执行官黄仁勋宣布推出 “视频分析 AI 代理蓝图(Blueprint for AI Agents )”。这一新平台基于英伟达的 Metropolis 系统,旨在帮助组织和个人提升生产力与安全性,甚至有助于运动员改善表现。
2025-01-17 15:39:36 105人关注
视频理解新突破!谷歌推通用视频模型VideoPrism 精准分类、定位、检索一网打尽!
在AI的世界里,让机器看懂视频,可比看懂图片难多了。视频是动态的,有声音,有动作,还有一堆复杂的场景。以前的AI,看视频就跟看天书似的,经常是一头雾水。
2025-01-14 09:39:40 87人关注
图像识别再进化!Meta推新一代SAM 2 支持实时视频追踪
Meta AI近日宣布推出新一代的Segment Anything Model(简称SAM2),这一技术突破使得在视频和图像中实时识别和跟踪特定对象变得轻而易举。
2025-01-07 06:35:21 307人关注
阿里通义千问团队推出Qwen2-VL模型 支持实时分析动态视频
阿里巴巴达摩院的通义千问团队在2024年8月30日宣布了其最新成果——Qwen2-VL模型的重大更新。Qwen2-VL模型在图像理解、视频处理和多语言支持方面均实现了显著提升,为关键性能指标设定了新的基准。
2024-12-30 15:24:40 95人关注
谷歌的 AI 新招数:视频分析、语音提问,广告也悄然来袭!
谷歌最近在其搜索引擎和谷歌镜头中推出了一系列令人兴奋的 AI 功能,让你在使用这些工具时不仅能找到信息,还能更深入地了解内容。现在,用户可以分析视频内容、使用语音输入,甚至获取 AI 生成的搜索结果摘要,简直是科技迷们的福音。
2024-12-24 13:30:38 63人关注
智源推出小时级超长视频理解大模型Video-XL
北京智源人工智能研究院联合上海交通大学、中国人民大学、北京大学和北京邮电大学等高校推出了一款名为Video-XL的超长视频理解大模型。这款模型是多模态大模型核心能力的重要展示,也是向通用人工智能(AGI)迈进的关键步骤。与现有多模态大模型相比,Video-XL在处理超过10分钟的长视频时,展现了更优的性能和效率。
2024-12-22 12:28:37 80人关注
Nvidia 推出 AI 蓝图,助力开发者轻松构建视频分析智能代理
Nvidia 近期宣布推出其最新的 AI 蓝图,旨在帮助各行业的开发者轻松构建智能代理,分析视频和图像内容。通过这一技术,任何行业的用户都能高效地搜索和总结大量的视觉数据。
2024-12-21 03:44:36 117人关注
英伟达重磅推出:AI视频理解新突破,让机器真正读懂视频内容
NVIDIA近日对外发布全新的AI视频搜索与摘要蓝图(AI Blueprint for Video Search and Summarization),这一技术方案将彻底改变传统视频分析的局限性。不同于过去仅能识别预设对象的固定模型,新方案通过结合生成式AI、视觉语言模型(VLM)和大语言模型(LLM),实现了对视频内容的深度理解和自然交互。