- 上云资讯 -
2025-05-16 18:27:33 76人关注
Meta AI 发布新型视频学习模型V-JEPA :视频理解新突破
近日,Meta AI 团队推出了视频联合嵌入预测架构(V-JEPA)模型,这一创新举措旨在推动机器智能的发展。人类能够自然而然地处理来自视觉信号的信息,进而识别周围的物体和运动模式。机器学习的一个重要目标是揭示促使人类进行无监督学习的基本原理。研究人员提出了一个关键假设 —— 预测特征原则,认为连续感官输入的表示应该能够相互预测。
2025-01-17 15:39:36 75人关注
视频理解新突破!谷歌推通用视频模型VideoPrism 精准分类、定位、检索一网打尽!
在AI的世界里,让机器看懂视频,可比看懂图片难多了。视频是动态的,有声音,有动作,还有一堆复杂的场景。以前的AI,看视频就跟看天书似的,经常是一头雾水。
2024-12-21 03:44:36 76人关注
英伟达重磅推出:AI视频理解新突破,让机器真正读懂视频内容
NVIDIA近日对外发布全新的AI视频搜索与摘要蓝图(AI Blueprint for Video Search and Summarization),这一技术方案将彻底改变传统视频分析的局限性。不同于过去仅能识别预设对象的固定模型,新方案通过结合生成式AI、视觉语言模型(VLM)和大语言模型(LLM),实现了对视频内容的深度理解和自然交互。