- 上云资讯 -
阿里云云原生
阿里云开发者
腾讯云开发者
火山引擎开发者社区
魔搭ModelScope社区
微软科技
Azure云科技
Zilliz
OpenAI
Anthropic
Gemini
LangChain
Hugging Face
Mistral
2025-04-18 14:41:38 87人关注
微软开源 OmniParser V2:让大语言模型“看懂”并操作 GUI
微软近日推出了其 Windows 操作大模型 OmniParser 的升级版本——OmniParser-v2.0。该模型能够识别桌面和窗口元素,并与之进行交互,标志着 AI Agent 技术在实现完全自动使用电脑的方向上又迈进了一步。
Microsoft OmniParser V2 GUI语言模型 语言模型技术 OmniParser V2新特性 Microsoft AI工具