- 上云资讯 -
2025-09-16 17:17:32 28人关注
Meta AI 发布 MobileLLM-R1:轻量级边缘推理模型,参数不足 10 亿,性能提升显著
Meta AI 近日推出了 MobileLLM-R1,这是一系列轻量级边缘推理模型,目前已在 Hugging Face 上发布。该系列模型参数范围从140M 到950M,专注于高效的数学、编码和科学推理,且在不足10亿的参数规模下实现了优秀的性能表现。
2025-09-06 16:13:35 140人关注
月之暗面发布 Kimi K2-0905:支持60-100Token/s,高速 API 全面开放
9月5日,月之暗面(Moonshot AI)官方宣布推出 Kimi K2模型最新版本(0905),在编程能力与任务处理性能方面进一步优化。
Kimi K2模型最新版本 月之暗面Moonshot AI Kimi K2编程能力优化 AI任务处理性能提升 Kimi K2 0905版本发布
2025-08-26 16:43:27 35人关注
谷歌Imagen 4正式上线 Gemini API 和 Google AI Studio
谷歌公司日前正式发布了全新的文本转图像生成模型Imagen4,该模型现已通过Gemini API和Google AI Studio平台向用户开放。据官方介绍,新版本在文本渲染性能方面较前代产品实现了显著提升。
2025-08-23 10:16:23 194人关注
kimi-k2-turbo-preview模型输出速度已提升至每秒 60 Tokens
8月22日,Moonshot AI宣布其Kimi K2模型的输出速度再次取得重大突破。经过工程师团队的不懈努力,kimi-k2-turbo-preview模型的输出速度已经提升至每秒60个Tokens,最高可达每秒100个Tokens。这一显著的速度提升,将进一步优化用户体验,满足更多场景下的高效需求。
Kimi K2模型提速 Moonshot AI模型升级 每秒60个Tokens AI输出速度优化 Kimi K2-turbo-preview性能提升 AI大模型加速技术
2025-08-12 13:21:14 62人关注
英特尔发布 LLM-Scaler1.0,助力 AI 推理性能提升
英特尔于2025年8月宣布了其 “战斗矩阵” 项目的最新软件更新,并推出了 LLM-Scaler1.0容器,以优化 Intel Arc B 系列显卡的 AI 推理支持。
英特尔战斗矩阵项目 LLM-Scaler1.0容器 Intel Arc B系列显卡 AI推理优化 2025年英特尔软件更新
2025-08-09 10:29:23 79人关注
PyTorch 2.8重磅发布:量化LLM推理性能飞跃,Intel GPU 支持来袭!
近日,开源机器学习框架 PyTorch 迎来了全新版本2.8的正式发布。这一版本的发布备受关注,主要集中在提升量化大语言模型(LLM)的推理性能,尤其是在 Intel CPU 上的表现。此次更新不仅显著增强了在离线模式下的推理效率,还首次实验性支持了 Intel GPU 的分布式后端。
PyTorch 2.8 新特性 量化大语言模型推理性能提升 Intel CPU 推理优化 离线模式推理效率 Intel GPU 分布式后端支持 PyTorch 量化 LLM 优化
2025-08-01 16:11:31 266人关注
Kimi K2 高速版kimi-k2-turbo-preview发布 输出每秒 40 Tokens
kimi-k2-turbo-preview,即Kimi K2高速版正式发布。据悉,该高速版模型在参数设置上与原版kimi-k2保持一致,但在性能上实现了显著提升,输出速度从原先的每秒10Tokens大幅跃升至每秒40Tokens,为用户带来更加流畅高效的使用体验。
Kimi K2高速版 Kimi K2性能提升 Kimi K2输出速度 Kimi K2高速版参数设置 Kimi K2使用体验
2025-07-30 10:18:28 255人关注
通义千问开源Qwen3-30B-A3B-Instruct-2507非思考模式模型
7月29日,Qwen3-30B-A3B模型推出了新版本Qwen3-30B-A3B-Instruct-2507。这一新版本在多个关键领域实现了显著提升,标志着该模型在非思考模式(non-thinking mode)下仅激活3B参数,就能达到与Gemini2.5-Flash(non-thinking)、GPT-4o等顶尖闭源模型相媲美的性能。
2025-07-28 13:10:34 74人关注
谷歌AI处理能力飙升:6月标记量突破980万亿,Gemini Flash2.5成增长引擎
据报道,谷歌的人工智能系统在6月份处理了超过980万亿个标记,这一数字是5月份的两倍多。据谷歌产品经理Logan Kilpatrick和DeepMind首席执行官Demis Hassabis透露,标记是AI模型理解或生成响应所使用的短文本块。
2025-07-26 12:21:12 143人关注
讯飞星火X1升级版发布:翻译、推理、文本生成能力大幅跃升!
近日,科大讯飞正式推出了升级版的星火 X1深度推理大模型,标志着国内人工智能技术的又一重大突破。此次升级不仅使星火 X1在翻译、推理、文本生成、数学等领域的综合能力实现了质的飞跃,更是将其性能提升至与国际一流模型如 OpenAI o3相媲美的水平。
科大讯飞星火 X1 深度推理大模型 AI大模型性能提升 星火 X1与国际模型对比 AI大模型技术突破 国内人工智能重大进展
2025-07-25 13:44:40 883人关注
阿里Wan 2.2即将震撼上线:开源视频生成AI挑战Sora
阿里巴巴云宣布其备受期待的视频生成AI模型Wan2.2即将在近期正式发布。作为Wan2.1的升级版本,Wan2.2预计在性能、效率和功能上实现重大突破,继续秉承阿里开源AI的战略,巩固其在全球AI视频生成领域的领先地位。继Wan2.1于2025年2月开源并取得广泛成功后,Wan2.2的推出引发了开发者社区和行业的热烈讨论。
阿里巴巴云Wan2.2 AI视频生成模型 Wan2.2性能提升 阿里开源AI战略 全球AI视频生成技术 Wan2.2发布
2025-07-19 10:28:10 109人关注
特斯拉Dojo 2芯片即将量产,性能直逼英伟达,马斯克笑言将改变游戏规则
在一场令人瞩目的发布会上,特斯拉创始人马斯克最近在北京高谈阔论,透露了公司最新的 Dojo2芯片即将进入量产阶段。这一代芯片的性能相较于首代提升了惊人的10倍,算力已经接近英伟达的 Blackwell B200。这意味着,特斯拉在自动驾驶领域的 FSD(全自动驾驶)将实现自给自足,减少对英伟达的依赖,甚至有可能开始对外提供算力服务。
特斯拉Dojo2芯片 Dojo2芯片量产 特斯拉FSD全自动驾驶 英伟达Blackwell B200对比 自动驾驶算力服务 特斯拉芯片性能提升
2025-06-18 13:20:21 148人关注
科大讯飞再发力!全新星火X1升级版将于7月重磅上线!
近日,科大讯飞在互动平台上透露,备受瞩目的讯飞星火 X1升级版预计将于今年7月正式发布。这一消息引发了业内人士和消费者的广泛关注,大家纷纷期待这款升级版的出色表现。
2025-05-29 16:31:34 320人关注
可灵2.1重磅上线:价格降65%,性能显著提升
备受关注的 AI 视频生成工具可灵2.1正式上线。这次更新不仅在性能上实现了显著提升,还大幅降低了价格,吸引了众多用户的目光。根据反馈,可灵2.1的效果、速度与性价比都令人惊艳,用户普遍表示这款新版本将大大改善他们的创作体验。