上云资讯 - 来上云吧，企业上云一站式服务

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-07-12 15:26:13 260人关注

微软全新 Phi-4-mini 版发布：推理效率提升 10 倍，轻松适配笔记本

微软今天凌晨在官网上开源了最新版本的 Phi-4家族模型 ——Phi-4-mini-flash-reasoning。这一新版本在继承了 Phi-4系列参数小、性能强的优点基础上，专为受到计算能力、内存和延迟限制的场景设计，能够在单个 GPU 上运行，非常适合笔记本和平板电脑等边缘设备。

微软Phi-4 Phi-4-mini-flash-reasoning 边缘设备AI模型轻量级AI模型单GPU运行AI模型 Phi-4系列性能优化

2025-05-29 10:12:15 220人关注

谷歌超低价AI模型Gemini 2.0 Flash-Lite正式上线

日前，Google 推出了其最经济的模型 Gemini2.0Flash-Lite，并且正式可用于生产用途。Gemini2.0Flash-Lite 是 Google Gemini 系列的一部分，定位为成本效率最高的选择，该模型在 Google AI Studio 和 Vertex AI 上提供公共预览，目标是服务于需要高性价比 AI 解决方案的开发者。

低成本AI模型 Google Gemini 2 Flash Lite AI模型新闻 Google AI技术轻量级AI模型

2025-05-22 16:33:36 538人关注

阿联酋推出两款新 AI 大模型聚焦阿拉伯语与轻量化应用

近日，在 “阿联酋制造” 大会上，阿布扎比技术创新研究院（TII）宣布推出两款新的人工智能大模型，分别为 Falcon Arabic 和 Falcon H1。这两款模型的发布，标志着阿联酋在人工智能领域的进一步发展，特别是在阿拉伯语环境和低算力应用市场的探索。

UAE AI模型阿拉伯语AI模型轻量级AI模型 AI模型新闻阿拉伯语自然语言处理

2025-03-21 16:17:17 271人关注

谷歌推出Gemma 3：单GPU上运行的最强AI模型

谷歌近日推出了最新版本的 Gemma AI 模型 ——Gemma3，声称这是 “全球最强的单加速器模型”。与之前发布的 Gemma AI 系列相比，Gemma3在性能上有了显著提升，尤其适合只配备一张 Nvidia H100显卡的开发者。该模型的设计初衷是为了帮助开发者创建能够在各种设备上运行的 AI 应用，从智能手机到工作站均可兼容。

Google Gemma 3 单GPU运行AI AI模型优化轻量级AI模型 Google Gemma 3性能

2025-01-22 04:34:33 304人关注

Nexa AI 发布 OmniAudio-2.6B：用于边缘部署的快速音频语言模型

Nexa AI近日推出了其全新的OmniAudio-2.6B音频语言模型，旨在满足边缘设备的高效部署需求。与传统的将自动语音识别（ASR）和语言模型分开的架构不同，OmniAudio-2.6B将Gemma-2-2b、Whisper Turbo以及定制的投影仪集成到一个统一框架中，这一设计消除了传统系统中各个组件链接所带来的低效率和延迟，特别适用于计算资源有限的设备。

Nexa AI OmniAudio 2.6B 边缘部署 AI模型部署轻量级AI模型边缘计算

2025-01-09 04:18:30 481人关注

为复杂视觉推理而生！微软发布Phi-3.5-vision 轻量级、多模态开源模型

微软最新发布了Phi-3.5-vision，一款轻量级、多模态的开源AI模型，它是Phi-3模型家族的新成员，专为需要同时处理文本和视觉输入的应用设计。Phi-3.5-vision模型在内存或计算资源受限的环境中表现出色，支持128K的上下文长度，是商业和研究领域的理想选择。

轻量级多模态模型 Phi-3-5-Vision模型多模态AI技术轻量级AI模型应用 Phi-3-5-Vision核心功能

- 上云资讯 -

微软全新 Phi-4-mini 版发布：推理效率提升 10 倍，轻松适配笔记本

谷歌超低价AI模型Gemini 2.0 Flash-Lite正式上线

阿联酋推出两款新 AI 大模型聚焦阿拉伯语与轻量化应用

谷歌推出Gemma 3：单GPU上运行的最强AI模型

Nexa AI 发布 OmniAudio-2.6B：用于边缘部署的快速音频语言模型

为复杂视觉推理而生！微软发布Phi-3.5-vision 轻量级、多模态开源模型

推荐阅读

上云服务

- 上云资讯 -

​微软全新 Phi-4-mini 版发布：推理效率提升 10 倍，轻松适配笔记本

谷歌超低价AI模型Gemini 2.0 Flash-Lite正式上线

​阿联酋推出两款新 AI 大模型 聚焦阿拉伯语与轻量化应用

谷歌推出Gemma 3：单GPU上运行的最强AI模型

Nexa AI 发布 OmniAudio-2.6B：用于边缘部署的快速音频语言模型

为复杂视觉推理而生！微软发布Phi-3.5-vision 轻量级、多模态开源模型

推荐阅读

上云服务

微软全新 Phi-4-mini 版发布：推理效率提升 10 倍，轻松适配笔记本

阿联酋推出两款新 AI 大模型聚焦阿拉伯语与轻量化应用