上云资讯 - 来上云吧，企业上云一站式服务

2025-09-03 17:20:43 359人关注

苹果重磅开源FastVLM与MobileCLIP2：85倍速度飙升，iPhone秒变AI神器！

近日，苹果公司低调地在Hugging Face平台上开源了两款重量级视觉语言模型（VLM）——FastVLM和MobileCLIP2，引发了AI领域的广泛关注。这两款模型以其惊艳的性能优化和高效的本地运行能力，为边缘设备AI应用开辟了新的可能性。AIbase编辑团队深入分析了这两款模型的技术亮点与潜在应用场景，为读者带来最新解读。

苹果开源视觉语言模型 FastVLM 性能优化 MobileCLIP2 本地运行能力边缘设备AI应用视觉语言模型技术亮点

2025-07-14 12:16:25 622人关注

重磅发布！月之暗面推出万亿参数开源大模型Kimi K2

中国人工智能企业月之暗面近日重磅推出其最新的开源大语言模型 ——Kimi K2。这一模型采用了混合专家架构，总参数量达到了惊人的1万亿，其中激活参数为320亿，表现出色，成为业内关注的焦点。

月之暗面 Kimi K2开源大模型万亿参数大模型混合专家架构大语言模型技术突破中国AI企业创新

2025-04-18 14:41:38 315人关注

微软开源 OmniParser V2：让大语言模型“看懂”并操作 GUI

微软近日推出了其 Windows 操作大模型 OmniParser 的升级版本——OmniParser-v2.0。该模型能够识别桌面和窗口元素，并与之进行交互，标志着 AI Agent 技术在实现完全自动使用电脑的方向上又迈进了一步。

Microsoft OmniParser V2 GUI语言模型语言模型技术 OmniParser V2新特性 Microsoft AI工具

2025-04-05 14:39:28 297人关注

研究警告AI语言模型极限:超8K上下文性能腰斩，概念推理成难关

慕尼黑大学、慕尼黑机器学习中心与Adobe Research近日联合发布的研究显示，包括GPT-4o、Gemini1.5Pro和Llama-3.3-70B在内的12款顶尖AI语言模型，在长文本概念推理任务中面临显著性能衰减。尽管这些模型均支持至少128，000个标记的上下文处理，但其深层逻辑关联能力仍存在根本性局限。

AI语言模型上下文性能概念推理 AI模型性能优化语言模型技术原理

2025-02-09 12:41:34 281人关注

Meta 提出新型可扩展记忆层，提升语言模型知识储备、减少幻觉现象

随着企业越来越多地应用大型语言模型（LLMs），如何提升模型的知识准确性并减少幻觉现象，成为了一项重要挑战。Meta AI 的研究人员在一篇新论文中提出了 “可扩展记忆层”，或许能够为这一问题提供解决方案。

meta语言模型可扩展内存层大语言模型技术内存层优化技术语言模型内存架构

2025-01-28 08:11:33 333人关注

MIT、 DeepMind研究揭示视觉语言模型无法理解否定表达的原因

在多模态任务中，视觉语言模型（VLMs）起着至关重要的作用，如图像检索、图像说明和医学诊断等。这些模型的目标是将视觉数据与语言数据进行对齐，以实现更高效的信息处理。然而，目前的 VLMs 在理解否定方面仍面临重大挑战。

MIT DeepMind VLM 视觉语言模型否定理解人工智能研究视觉语言模型技术

2025-01-22 05:39:19 1623人关注

DeepSeek-AI开源DeepSeek-VL2系列:3B、16B 和27B参数三种模型

随着人工智能的快速发展，视觉与语言能力的整合引发了视觉语言模型（VLMs）的突破性进展。这些模型旨在同时处理和理解视觉与文本数据，广泛应用于图像描述、视觉问答、光学字符识别以及多模态内容分析等场景。

DeepSeek VL2 3B模型 16B模型 27B模型大语言模型技术多模态AI模型

2025-01-03 09:26:15 254人关注

无标记化的语言模型T-FREE 像施了魔法一样高效！

研究团队最近带来了一个令人兴奋的新方法，叫做 T-FREE，让大型语言模型的运作效率直线上升。来自 Aleph Alpha、达姆施塔特工业大学、hessian.AI 和德国人工智能研究中心（DFKI）的科学家们联合推出了这个令人惊叹的技术，它的全名是 “无需标记器的稀疏表示，可实现内存高效嵌入”。

高效语言模型免费语言模型语言模型技术语言模型应用场景语言模型优化技巧

2024-12-30 19:33:18 351人关注

富士通推出 Takane 大型语言模型，助力企业智能化升级

最近，富士通正式发布了名为 “Takane” 的大型语言模型（LLM），这款模型特别为企业用户打造，旨在满足安全私密环境下的需求。

Fujitsu 大语言模型 Takane LLM Fujitsu大语言模型技术 Takane大模型应用

2024-12-30 12:26:37 325人关注

谷歌推出 Gemma-2-JPN：一款针对日本市场的先进 AI 语言模型

近日，谷歌宣布推出一款名为 “gemma-2-2b-jpn-it” 的新模型，这是其 Gemma 系列语言模型的最新成员。这个模型专门针对日本语言进行优化，展示了谷歌在大型语言模型（LLM）领域持续投入的决心。

Google Gemma 2 日语AI语言模型 AI大模型语言模型技术 Google AI新成果日语自然语言处理

2024-12-22 12:44:25 277人关注

Hugging Face发布SmolLM2：小型语言模型挑战行业巨头

Hugging Face今天发布了SmolLM2，一组新的紧凑型语言模型，实现了令人印象深刻的性能，同时所需的计算资源比大型模型少得多。新模型采用Apache2.0许可发布，有三种大小——135M、360M和1.7B参数——适合部署在智能手机和其他处理能力和内存有限的边缘设备上。

Hugging Face SmolLM2 小语言模型语言模型技术小模型优化模型训练技巧

- 上云资讯 -

苹果重磅开源FastVLM与MobileCLIP2：85倍速度飙升，iPhone秒变AI神器！

重磅发布！月之暗面推出万亿参数开源大模型Kimi K2

微软开源 OmniParser V2：让大语言模型“看懂”并操作 GUI

研究警告AI语言模型极限:超8K上下文性能腰斩，概念推理成难关

Meta 提出新型可扩展记忆层，提升语言模型知识储备、减少幻觉现象

MIT、 DeepMind研究揭示视觉语言模型无法理解否定表达的原因

DeepSeek-AI开源DeepSeek-VL2系列:3B、16B 和27B参数三种模型

无标记化的语言模型T-FREE 像施了魔法一样高效！

富士通推出 Takane 大型语言模型，助力企业智能化升级

谷歌推出 Gemma-2-JPN：一款针对日本市场的先进 AI 语言模型

Hugging Face发布SmolLM2：小型语言模型挑战行业巨头

推荐阅读

上云服务

- 上云资讯 -

苹果重磅开源FastVLM与MobileCLIP2：85倍速度飙升，iPhone秒变AI神器！

重磅发布！月之暗面推出万亿参数开源大模型Kimi K2

微软开源 OmniParser V2：让大语言模型“看懂”并操作 GUI

研究警告AI语言模型极限:超8K上下文性能腰斩，概念推理成难关

Meta 提出新型可扩展记忆层，提升语言模型知识储备、减少幻觉现象

​MIT、 DeepMind研究揭示视觉语言模型无法理解否定表达的原因

DeepSeek-AI开源DeepSeek-VL2系列:3B、16B 和27B参数三种模型

无标记化的语言模型T-FREE 像施了魔法一样高效！

​富士通推出 Takane 大型语言模型，助力企业智能化升级

​谷歌推出 Gemma-2-JPN：一款针对日本市场的先进 AI 语言模型

Hugging Face发布SmolLM2：小型语言模型挑战行业巨头

推荐阅读

上云服务

MIT、 DeepMind研究揭示视觉语言模型无法理解否定表达的原因

富士通推出 Takane 大型语言模型，助力企业智能化升级

谷歌推出 Gemma-2-JPN：一款针对日本市场的先进 AI 语言模型