上云资讯 - 来上云吧，企业上云一站式服务

2025-09-09 08:27:35 20人关注

Baseten 获得 1.5 亿美元 D 轮融资，推动 AI 推理平台快速发展

近日，Baseten 宣布完成1.5亿美元的 D 轮融资，公司的估值已达到21.5亿美元。这轮融资由 BOND 领投，新投资方包括 CapitalG、Premji，以及 Scribble 的 Kevin 和 Elizabeth Weil，同时还吸引了现有投资者 Conviction、01a、IVP、Spark 和 Greylock 的参与。这次融资使 Baseten 的总融资额超过了2.85亿美元。

Baseten D轮融资 AI基础设施融资 AI模型部署平台 Baseten估值 BOND领投融资 CapitalG投资AI

2025-07-16 15:32:13 615人关注

Unsloth AI发布1.8bit量化Kimi K2模型，显著降低部署成本

7月14日，Unsloth AI宣布成功将Moonshot AI的Kimi K2模型量化为1.8bit版本，大幅压缩模型体积并降低部署成本。根据AIbase报道，这一技术突破使Kimi K2从原始的1.1TB缩减至245GB，体积减少约80%，同时保持了全部代码测试性能。此举被视为开源AI领域的重要进展，引发了业界广泛关注。

Kimi K2模型量化 1.8bit量化技术模型体积压缩开源AI技术进展 Unsloth AI技术突破 AI模型部署成本优化

2025-06-02 10:20:41 149人关注

Ollama v0.8发布！AI流式响应+实时搜索，本地模型也能秒变智能助手！

Ollama官方宣布推出其最新版本Ollama v0.8，为本地运行大型语言模型（LLM）带来了突破性升级。新版本引入了流式传输响应和工具调用功能，支持实时网络搜索等交互场景，显著提升了本地AI的实用性和灵活性。AIbase为您整理了Ollama v0.8的核心亮点及其对AI生态的影响。

Ollama v0.8 AI streaming 本地模型运行 AI模型部署本地AI模型优化

2025-05-03 08:42:42 164人关注

昆仑万维旗下Opera接入DeepSeek R1模型支持本地个性化部署

2月17日，昆仑万维旗下的Opera团队在Opera Developer中接入了DeepSeek R1系列模型，实现了本地个性化部署。这一举措标志着Opera在AI技术应用方面的进一步拓展，为用户提供了更强大的本地AI功能。

DeepSeek R1 本地部署 Opera DeepSeek R1 大模型本地化 AI模型部署 DeepSeek R1 部署指南

2025-01-24 12:32:31 124人关注

Hugging Face 推出小巧AI模型，助力设备性能提升

近期，人工智能开发平台 Hugging Face 团队发布了两款新型 AI 模型，SmolVLM-256M 和 SmolVLM-500M。他们自信地声称，这两款模型是目前为止体积最小的 AI 模型，能够同时处理图像、短视频和文本数据，尤其适合内存少于1GB 的设备如笔记本电脑。这一创新让开发者在处理大量数据时，能够以更低的成本实现更高的效率。

Hugging Face 小模型设备性能优化 AI模型部署轻量级AI应用

2025-01-22 04:34:33 150人关注

Nexa AI 发布 OmniAudio-2.6B：用于边缘部署的快速音频语言模型

Nexa AI近日推出了其全新的OmniAudio-2.6B音频语言模型，旨在满足边缘设备的高效部署需求。与传统的将自动语音识别（ASR）和语言模型分开的架构不同，OmniAudio-2.6B将Gemma-2-2b、Whisper Turbo以及定制的投影仪集成到一个统一框架中，这一设计消除了传统系统中各个组件链接所带来的低效率和延迟，特别适用于计算资源有限的设备。

Nexa AI OmniAudio 2.6B 边缘部署 AI模型部署轻量级AI模型边缘计算

2025-01-21 20:11:15 178人关注

Cohere 推出 Command R7B 模型：小型高效，可在低端设备运行

在快速发展的人工智能领域，Cohere 公司近日推出了其最新模型 Command R7B，标志着该公司在为企业提供高效解决方案方面又向前迈出了重要一步。作为 R 系列中最小、速度最快的模型，Command R7B 专注于支持快速原型开发和迭代，采用了检索增强生成（RAG）技术，提升了模型的准确性。

Cohere Command R7B 小型高效模型低端设备优化 AI模型轻量化高效AI模型部署

2025-01-17 05:45:13 131人关注

开源模型新突破！H2O-Danube3：手机不联网也能用的本地模型

在当今快速发展的人工智能领域，小型语言模型（LLMs）正变得越来越重要。它们不仅能够在消费级硬件上高效运行，还能支持完全离线的应用场景。H2O.ai 团队自豪地推出了 H2O-Danube3，一系列小型语言模型，它们在多种学术、聊天和微调基准测试中展现出了高度竞争力。

H2O Danube3 本地模型离线使用大模型技术 AI模型部署

2025-01-16 18:28:27 100人关注

NVIDIA研究人员推Flextron框架：支持灵活AI模型部署无需额外微调

在人工智能领域，大型语言模型（LLMs）如GPT-3和Llama-2已经取得了显著进展，能够准确理解和生成人类语言。然而，这些模型庞大的参数量使得它们在训练和部署过程中需要大量的计算资源，这对资源有限的环境构成了挑战。

FlexTron框架 AI模型部署灵活AI模型部署 FlexTron框架应用 FlexTron框架技术

2025-01-05 14:43:19 484人关注

YC 孵化开源神器 AnythingLLM：一键运行 AI 模型，与文档聊天

AnythingLLM 是一款面向所有人的一体化人工智能应用程序。任何人都可以在本地轻松构建基于 LLM 的 AI 应用程序，无需昂贵的云端 AI 服务或繁琐的模型部署流程。它集成了 RAG、向量数据库和强大的代理功能，因此任何企业或个人都可以轻松利用 AI 的潜力。

AnythingLLM AI模型运行 AI大模型应用 LLM技术实践云端AI模型部署

2024-12-29 20:11:12 132人关注

200万用户量！Hugging Face旗下Gradio 5发布：用自然语言轻松构建AI应用

最近，AI 初创公司 Hugging Face 正式推出了 Gradio5，这是他们广受欢迎的开源工具的一次重大更新，旨在使 AI 开发变得更加简单。

Hugging Face Gradio 5 自然语言AI应用 AI应用开发 AI模型部署

2024-12-25 13:13:23 139人关注

GE医疗利用 AWS打造首个全身3D MRI模型，实现更精准医学影像解析

MRI 图像因其复杂性和数据量大，一直以来都是医学影像分析中的一大挑战。为了训练大型语言模型（LLM）进行 MRI 分析，开发者不得不将获取的图像切割为2D 图像，这样的处理虽然可行，但却限制了模型对复杂解剖结构的分析能力，尤其是在脑肿瘤、骨骼疾病或心血管疾病等复杂案例中。

GE医疗3D MRI模型 AWS医疗影像解决方案医疗AI模型部署医学影像云计算 3D MRI技术应用

- 上云资讯 -

Baseten 获得 1.5 亿美元 D 轮融资，推动 AI 推理平台快速发展

Unsloth AI发布1.8bit量化Kimi K2模型，显著降低部署成本

Ollama v0.8发布！AI流式响应+实时搜索，本地模型也能秒变智能助手！

昆仑万维旗下Opera接入DeepSeek R1模型支持本地个性化部署

Hugging Face 推出小巧AI模型，助力设备性能提升

Nexa AI 发布 OmniAudio-2.6B：用于边缘部署的快速音频语言模型

Cohere 推出 Command R7B 模型：小型高效，可在低端设备运行

开源模型新突破！H2O-Danube3：手机不联网也能用的本地模型

NVIDIA研究人员推Flextron框架：支持灵活AI模型部署无需额外微调

YC 孵化开源神器 AnythingLLM：一键运行 AI 模型，与文档聊天

200万用户量！Hugging Face旗下Gradio 5发布：用自然语言轻松构建AI应用

GE医疗利用 AWS打造首个全身3D MRI模型，实现更精准医学影像解析

推荐阅读

上云服务

- 上云资讯 -

​Baseten 获得 1.5 亿美元 D 轮融资，推动 AI 推理平台快速发展

Unsloth AI发布1.8bit量化Kimi K2模型，显著降低部署成本

Ollama v0.8发布！AI流式响应+实时搜索，本地模型也能秒变智能助手！

昆仑万维旗下Opera接入DeepSeek R1模型 支持本地个性化部署

Hugging Face 推出小巧AI模型，助力设备性能提升

Nexa AI 发布 OmniAudio-2.6B：用于边缘部署的快速音频语言模型

Cohere 推出 Command R7B 模型：小型高效，可在低端设备运行

开源模型新突破！H2O-Danube3：手机不联网也能用的本地模型

NVIDIA研究人员推Flextron框架：支持灵活AI模型部署 无需额外微调

YC 孵化开源神器 AnythingLLM：一键运行 AI 模型，与文档聊天

200万用户量！​Hugging Face旗下Gradio 5发布：用自然语言轻松构建AI应用

GE医疗利用 AWS打造首个全身3D MRI模型，实现更精准医学影像解析

推荐阅读

上云服务

Baseten 获得 1.5 亿美元 D 轮融资，推动 AI 推理平台快速发展

昆仑万维旗下Opera接入DeepSeek R1模型支持本地个性化部署

NVIDIA研究人员推Flextron框架：支持灵活AI模型部署无需额外微调

200万用户量！Hugging Face旗下Gradio 5发布：用自然语言轻松构建AI应用