- 上云资讯 -
2025-07-12 15:26:13 72人关注
微软全新 Phi-4-mini 版发布:推理效率提升 10 倍,轻松适配笔记本
微软今天凌晨在官网上开源了最新版本的 Phi-4家族模型 ——Phi-4-mini-flash-reasoning。这一新版本在继承了 Phi-4系列参数小、性能强的优点基础上,专为受到计算能力、内存和延迟限制的场景设计,能够在单个 GPU 上运行,非常适合笔记本和平板电脑等边缘设备。
微软Phi-4 Phi-4-mini-flash-reasoning 边缘设备AI模型 轻量级AI模型 单GPU运行AI模型 Phi-4系列性能优化
2025-05-29 10:12:15 62人关注
谷歌超低价AI模型Gemini 2.0 Flash-Lite正式上线
日前,Google 推出了其最经济的模型 Gemini2.0Flash-Lite,并且正式可用于生产用途。Gemini2.0Flash-Lite 是 Google Gemini 系列的一部分,定位为成本效率最高的选择,该模型在 Google AI Studio 和 Vertex AI 上提供公共预览,目标是服务于需要高性价比 AI 解决方案的开发者。
低成本AI模型 Google Gemini 2 Flash Lite AI模型新闻 Google AI技术 轻量级AI模型
2025-05-22 16:33:36 102人关注
阿联酋推出两款新 AI 大模型 聚焦阿拉伯语与轻量化应用
近日,在 “阿联酋制造” 大会上,阿布扎比技术创新研究院(TII)宣布推出两款新的人工智能大模型,分别为 Falcon Arabic 和 Falcon H1。这两款模型的发布,标志着阿联酋在人工智能领域的进一步发展,特别是在阿拉伯语环境和低算力应用市场的探索。
2025-03-21 16:17:17 93人关注
谷歌推出Gemma 3:单GPU上运行的最强AI模型
谷歌近日推出了最新版本的 Gemma AI 模型 ——Gemma3,声称这是 “全球最强的单加速器模型”。与之前发布的 Gemma AI 系列相比,Gemma3在性能上有了显著提升,尤其适合只配备一张 Nvidia H100显卡的开发者。该模型的设计初衷是为了帮助开发者创建能够在各种设备上运行的 AI 应用,从智能手机到工作站均可兼容。
2025-01-22 04:34:33 114人关注
Nexa AI 发布 OmniAudio-2.6B:用于边缘部署的快速音频语言模型
Nexa AI近日推出了其全新的OmniAudio-2.6B音频语言模型,旨在满足边缘设备的高效部署需求。与传统的将自动语音识别(ASR)和语言模型分开的架构不同,OmniAudio-2.6B将Gemma-2-2b、Whisper Turbo以及定制的投影仪集成到一个统一框架中,这一设计消除了传统系统中各个组件链接所带来的低效率和延迟,特别适用于计算资源有限的设备。
2025-01-09 04:18:30 167人关注
为复杂视觉推理而生!微软发布Phi-3.5-vision 轻量级、多模态开源模型
微软最新发布了Phi-3.5-vision,一款轻量级、多模态的开源AI模型,它是Phi-3模型家族的新成员,专为需要同时处理文本和视觉输入的应用设计。Phi-3.5-vision模型在内存或计算资源受限的环境中表现出色,支持128K的上下文长度,是商业和研究领域的理想选择。
轻量级多模态模型 Phi-3-5-Vision模型 多模态AI技术 轻量级AI模型应用 Phi-3-5-Vision核心功能