上云资讯 - 来上云吧，企业上云一站式服务

2025-11-24 13:19:19 128人关注

谷歌：计划未来 4-5 年在相同成本和能耗性能提升 1000 倍

在近期的全员大会上，谷歌正式推出了其最新的 AI 大模型 ——Gemini3系列。这一系列被誉为当前最强的 AI 模型，甚至超越了市场竞争对手 OpenAI 的产品，引发了科技界的广泛关注，谷歌的股价也因此大幅上涨。

2025-11-12 11:12:40 122人关注

约翰・霍普金斯大学发布 EGO-Prompt 框架，助力小型 AI 模型实现大模型性能提升

近日，约翰・霍普金斯大学推出了一种名为 EGO-Prompt 的框架，该框架显著提高了小型语言模型在专业领域任务中的表现，性能提升近50%，同时将成本降低了83%。这一创新的框架主要用于解决专业领域任务，如医疗诊断和交通管理，使得小型 AI 模型能够媲美大型推理模型。

AI

2025-09-16 17:17:32 262人关注

Meta AI 发布 MobileLLM-R1：轻量级边缘推理模型，参数不足 10 亿，性能提升显著

Meta AI 近日推出了 MobileLLM-R1，这是一系列轻量级边缘推理模型，目前已在 Hugging Face 上发布。该系列模型参数范围从140M 到950M，专注于高效的数学、编码和科学推理，且在不足10亿的参数规模下实现了优秀的性能表现。

AI

2025-09-12 09:19:41 221人关注

全新多语种编码器 mmBERT：超越 XLM-R，提升速度与效率

近日，约翰霍普金斯大学的一组研究人员推出了 mmBERT，这是一款新型的多语种编码器，旨在填补当前多语种自然语言处理领域的空白。该模型在多个任务上超越了 XLM-R，且在速度上比以往模型提升了2到4倍，为多语种应用的研究和开发提供了更强大的支持。

多语种编码器 mmBERT模型多语种自然语言处理跨语言NLP技术多语种模型性能提升

2025-09-12 08:24:30 417人关注

Replit发布Agent 3智能开发助手，运行时长提升至200分钟

在线编程平台Replit于9月11日正式发布第三代AI开发助手Agent3，该产品在自主性能方面实现重大突破，连续运行时间从前代的2分钟大幅提升至200分钟。这一升级使Agent3能够独立完成从代码编写到测试修复的完整开发流程。

Replit Agent3 第三代AI开发助手自主性能提升 AI开发流程自动化代码编写测试修复连续运行时间提升

2025-09-10 18:42:43 796人关注

80亿参数只用3亿！阿里千问3新模型推理速度暴增10倍

阿里巴巴通义千问团队刚刚向全球开发者抛出了一枚重磅炸弹，他们即将发布的Qwen3-Next-80B-A3B-Instruct模型彻底颠覆了传统大模型的运行逻辑。这个看似矛盾的数字组合背后，藏着一个令人惊叹的技术突破:总参数高达80亿，但实际激活的参数仅有3亿，就像一台超级跑车只用了十分之一的引擎却跑出了十倍的速度。

通义千问模型大模型推理优化稀疏激活技术高效AI计算 80亿参数模型 3亿激活参数模型性能提升

2025-09-06 16:13:35 582人关注

月之暗面发布 Kimi K2-0905：支持60-100Token/s，高速 API 全面开放

9月5日，月之暗面（Moonshot AI）官方宣布推出 Kimi K2模型最新版本（0905），在编程能力与任务处理性能方面进一步优化。

2025-08-26 16:43:27 238人关注

谷歌Imagen 4正式上线 Gemini API 和 Google AI Studio

谷歌公司日前正式发布了全新的文本转图像生成模型Imagen4，该模型现已通过Gemini API和Google AI Studio平台向用户开放。据官方介绍，新版本在文本渲染性能方面较前代产品实现了显著提升。

Imagen4模型文本转图像生成模型 Gemini API Google AI Studio 文本渲染性能提升

2025-08-23 10:16:23 740人关注

kimi-k2-turbo-preview模型输出速度已提升至每秒 60 Tokens

8月22日，Moonshot AI宣布其Kimi K2模型的输出速度再次取得重大突破。经过工程师团队的不懈努力，kimi-k2-turbo-preview模型的输出速度已经提升至每秒60个Tokens，最高可达每秒100个Tokens。这一显著的速度提升，将进一步优化用户体验，满足更多场景下的高效需求。

Kimi K2模型提速 Moonshot AI模型升级每秒60个Tokens AI输出速度优化 Kimi K2-turbo-preview性能提升 AI大模型加速技术

2025-08-13 08:14:26 281人关注

华为推新技术优化大模型推理：UCM 技术缓解 HBM 依赖

8月12日，华为将在 2025金融AI推理应用落地与发展论坛上发布突破性 AI 推理创新技术 UCM（推理记忆数据管理器）。该技术有望降低中国 AI 推理对 HBM（高带宽内存）的依赖，并显著提升国内大模型推理性能。

华为AI推理技术金融AI推理应用 UCM技术发布 AI推理性能提升降低HBM依赖大模型推理优化

2025-08-12 13:21:14 224人关注

英特尔发布 LLM-Scaler1.0，助力 AI 推理性能提升

英特尔于2025年8月宣布了其 “战斗矩阵” 项目的最新软件更新，并推出了 LLM-Scaler1.0容器，以优化 Intel Arc B 系列显卡的 AI 推理支持。

英特尔战斗矩阵项目 LLM-Scaler1.0容器 Intel Arc B系列显卡 AI推理优化 2025年英特尔软件更新

2025-08-09 10:29:23 338人关注

PyTorch 2.8重磅发布：量化LLM推理性能飞跃，Intel GPU 支持来袭！

近日，开源机器学习框架 PyTorch 迎来了全新版本2.8的正式发布。这一版本的发布备受关注，主要集中在提升量化大语言模型（LLM）的推理性能，尤其是在 Intel CPU 上的表现。此次更新不仅显著增强了在离线模式下的推理效率，还首次实验性支持了 Intel GPU 的分布式后端。

PyTorch 2.8 新特性量化大语言模型推理性能提升 Intel CPU 推理优化离线模式推理效率 Intel GPU 分布式后端支持 PyTorch 量化 LLM 优化

2025-08-01 16:11:31 681人关注

Kimi K2 高速版kimi-k2-turbo-preview发布输出每秒 40 Tokens

kimi-k2-turbo-preview，即Kimi K2高速版正式发布。据悉，该高速版模型在参数设置上与原版kimi-k2保持一致，但在性能上实现了显著提升，输出速度从原先的每秒10Tokens大幅跃升至每秒40Tokens，为用户带来更加流畅高效的使用体验。

Kimi K2高速版 Kimi K2性能提升 Kimi K2输出速度 Kimi K2高速版参数设置 Kimi K2使用体验

2025-07-30 10:18:28 887人关注

通义千问开源Qwen3-30B-A3B-Instruct-2507非思考模式模型

7月29日，Qwen3-30B-A3B模型推出了新版本Qwen3-30B-A3B-Instruct-2507。这一新版本在多个关键领域实现了显著提升，标志着该模型在非思考模式（non-thinking mode）下仅激活3B参数，就能达到与Gemini2.5-Flash(non-thinking)、GPT-4o等顶尖闭源模型相媲美的性能。

Qwen3-30B-A3B-Instruct-2507 非思考模式 3B参数激活大模型性能提升顶尖闭源模型对比

2025-07-28 13:10:34 215人关注

谷歌AI处理能力飙升:6月标记量突破980万亿，Gemini Flash2.5成增长引擎

据报道，谷歌的人工智能系统在6月份处理了超过980万亿个标记，这一数字是5月份的两倍多。据谷歌产品经理Logan Kilpatrick和DeepMind首席执行官Demis Hassabis透露，标记是AI模型理解或生成响应所使用的短文本块。

谷歌AI系统 AI标记处理量 AI模型响应生成 DeepMind技术动态 AI系统性能提升

2025-07-26 12:21:12 360人关注

讯飞星火X1升级版发布：翻译、推理、文本生成能力大幅跃升！

近日，科大讯飞正式推出了升级版的星火 X1深度推理大模型，标志着国内人工智能技术的又一重大突破。此次升级不仅使星火 X1在翻译、推理、文本生成、数学等领域的综合能力实现了质的飞跃，更是将其性能提升至与国际一流模型如 OpenAI o3相媲美的水平。

科大讯飞星火 X1 深度推理大模型 AI大模型性能提升星火 X1与国际模型对比 AI大模型技术突破国内人工智能重大进展

2025-07-25 13:44:40 1452人关注

阿里Wan 2.2即将震撼上线：开源视频生成AI挑战Sora

阿里巴巴云宣布其备受期待的视频生成AI模型Wan2.2即将在近期正式发布。作为Wan2.1的升级版本，Wan2.2预计在性能、效率和功能上实现重大突破，继续秉承阿里开源AI的战略，巩固其在全球AI视频生成领域的领先地位。继Wan2.1于2025年2月开源并取得广泛成功后，Wan2.2的推出引发了开发者社区和行业的热烈讨论。

阿里巴巴云Wan2.2 AI视频生成模型 Wan2.2性能提升阿里开源AI战略全球AI视频生成技术 Wan2.2发布

2025-07-19 10:28:10 253人关注

特斯拉Dojo 2芯片即将量产，性能直逼英伟达，马斯克笑言将改变游戏规则

在一场令人瞩目的发布会上，特斯拉创始人马斯克最近在北京高谈阔论，透露了公司最新的 Dojo2芯片即将进入量产阶段。这一代芯片的性能相较于首代提升了惊人的10倍，算力已经接近英伟达的 Blackwell B200。这意味着，特斯拉在自动驾驶领域的 FSD（全自动驾驶）将实现自给自足，减少对英伟达的依赖，甚至有可能开始对外提供算力服务。

特斯拉Dojo2芯片 Dojo2芯片量产特斯拉FSD全自动驾驶英伟达Blackwell B200对比自动驾驶算力服务特斯拉芯片性能提升

2025-06-18 13:20:21 367人关注

科大讯飞再发力！全新星火X1升级版将于7月重磅上线！

近日，科大讯飞在互动平台上透露，备受瞩目的讯飞星火 X1升级版预计将于今年7月正式发布。这一消息引发了业内人士和消费者的广泛关注，大家纷纷期待这款升级版的出色表现。

科大讯飞星火X1升级版讯飞星火X1发布时间星火X1升级版功能科大讯飞AI技术讯飞星火X1性能提升

2025-06-17 15:40:19 1852人关注

豆包大模型再进化！全球领先，AI Agent 应用加速落地！

近日，豆包大模型迎来了全新1.6版本，标志着其综合能力的再次跃升。在推理、数学、指令遵循等多个核心领域，豆包1.6实现了显著的性能提升，同时大幅降低了用户使用的门槛，推动 AI Agent 在消费电子、汽车、金融等行业的快速应用。

豆包大模型1.6 大模型性能提升 AI Agent行业应用大模型推理能力大模型数学能力指令遵循优化

- 上云资讯 -

谷歌：计划未来 4-5 年在相同成本和能耗性能提升 1000 倍

约翰・霍普金斯大学发布 EGO-Prompt 框架，助力小型 AI 模型实现大模型性能提升

Meta AI 发布 MobileLLM-R1：轻量级边缘推理模型，参数不足 10 亿，性能提升显著

全新多语种编码器 mmBERT：超越 XLM-R，提升速度与效率

Replit发布Agent 3智能开发助手，运行时长提升至200分钟

80亿参数只用3亿！阿里千问3新模型推理速度暴增10倍

月之暗面发布 Kimi K2-0905：支持60-100Token/s，高速 API 全面开放

谷歌Imagen 4正式上线 Gemini API 和 Google AI Studio

kimi-k2-turbo-preview模型输出速度已提升至每秒 60 Tokens

华为推新技术优化大模型推理：UCM 技术缓解 HBM 依赖

英特尔发布 LLM-Scaler1.0，助力 AI 推理性能提升

PyTorch 2.8重磅发布：量化LLM推理性能飞跃，Intel GPU 支持来袭！

Kimi K2 高速版kimi-k2-turbo-preview发布输出每秒 40 Tokens

通义千问开源Qwen3-30B-A3B-Instruct-2507非思考模式模型

谷歌AI处理能力飙升:6月标记量突破980万亿，Gemini Flash2.5成增长引擎

讯飞星火X1升级版发布：翻译、推理、文本生成能力大幅跃升！

阿里Wan 2.2即将震撼上线：开源视频生成AI挑战Sora

特斯拉Dojo 2芯片即将量产，性能直逼英伟达，马斯克笑言将改变游戏规则

科大讯飞再发力！全新星火X1升级版将于7月重磅上线！

豆包大模型再进化！全球领先，AI Agent 应用加速落地！

推荐阅读

上云服务

- 上云资讯 -

谷歌：计划未来 4-5 年在相同成本和能耗性能提升 1000 倍

​约翰・霍普金斯大学发布 EGO-Prompt 框架，助力小型 AI 模型实现大模型性能提升

​Meta AI 发布 MobileLLM-R1：轻量级边缘推理模型，参数不足 10 亿，性能提升显著

全新多语种编码器 mmBERT：超越 XLM-R，提升速度与效率

Replit发布Agent 3智能开发助手，运行时长提升至200分钟

80亿参数只用3亿！阿里千问3新模型推理速度暴增10倍

月之暗面发布 Kimi K2-0905：支持60-100Token/s，高速 API 全面开放

谷歌Imagen 4正式上线 Gemini API 和 Google AI Studio

kimi-k2-turbo-preview模型输出速度已提升至每秒 60 Tokens

华为推新技术优化大模型推理：UCM 技术缓解 HBM 依赖

英特尔发布 LLM-Scaler1.0，助力 AI 推理性能提升

PyTorch 2.8重磅发布：量化LLM推理性能飞跃，Intel GPU 支持来袭！

Kimi K2 高速版kimi-k2-turbo-preview发布 输出每秒 40 Tokens

通义千问开源Qwen3-30B-A3B-Instruct-2507非思考模式模型

谷歌AI处理能力飙升:6月标记量突破980万亿，Gemini Flash2.5成增长引擎

讯飞星火X1升级版发布：翻译、推理、文本生成能力大幅跃升！

阿里Wan 2.2即将震撼上线：开源视频生成AI挑战Sora

特斯拉Dojo 2芯片即将量产，性能直逼英伟达，马斯克笑言将改变游戏规则

科大讯飞再发力！全新星火X1升级版将于7月重磅上线！

豆包大模型再进化！全球领先，AI Agent 应用加速落地！

推荐阅读

上云服务

约翰・霍普金斯大学发布 EGO-Prompt 框架，助力小型 AI 模型实现大模型性能提升

Meta AI 发布 MobileLLM-R1：轻量级边缘推理模型，参数不足 10 亿，性能提升显著

Kimi K2 高速版kimi-k2-turbo-preview发布输出每秒 40 Tokens