上云资讯 - 来上云吧，企业上云一站式服务

2025-09-11 11:33:36 352人关注

上海交大发布 MobiAgent：人人都能拥有自己的 AI 助手，超越 GPT-5！

近日，上海交通大学的 IPADS 实验室团队推出了一款名为 MobiAgent 的全新移动端智能体工具链，打破了个人化智能助手的开发壁垒，声称其真实场景表现优于 GPT-5和其他顶级闭源模型。

MobiAgent 移动端智能体工具链上海交通大学IPADS实验室个人化智能助手开发 GPT-5替代方案移动端AI性能优化

2025-09-08 18:33:16 191人关注

Roblox推出类TikTok短视频功能提升创作者收益并发布多项AI工具

在线游戏平台Roblox周五在开发者大会上宣布推出名为"Roblox Moments"的短视频分享功能，该功能类似TikTok，专门用于分享游戏精彩时刻。同时，公司还公布了提高创作者收益、新增AI工具以及性能优化等多项重要更新。

Roblox短视频功能 Roblox Moments 游戏短视频分享 Roblox创作者收益 Roblox AI工具 Roblox性能优化

2025-09-03 17:20:43 322人关注

苹果重磅开源FastVLM与MobileCLIP2：85倍速度飙升，iPhone秒变AI神器！

近日，苹果公司低调地在Hugging Face平台上开源了两款重量级视觉语言模型（VLM）——FastVLM和MobileCLIP2，引发了AI领域的广泛关注。这两款模型以其惊艳的性能优化和高效的本地运行能力，为边缘设备AI应用开辟了新的可能性。AIbase编辑团队深入分析了这两款模型的技术亮点与潜在应用场景，为读者带来最新解读。

苹果开源视觉语言模型 FastVLM 性能优化 MobileCLIP2 本地运行能力边缘设备AI应用视觉语言模型技术亮点

2025-07-12 15:26:13 224人关注

微软全新 Phi-4-mini 版发布：推理效率提升 10 倍，轻松适配笔记本

微软今天凌晨在官网上开源了最新版本的 Phi-4家族模型 ——Phi-4-mini-flash-reasoning。这一新版本在继承了 Phi-4系列参数小、性能强的优点基础上，专为受到计算能力、内存和延迟限制的场景设计，能够在单个 GPU 上运行，非常适合笔记本和平板电脑等边缘设备。

微软Phi-4 Phi-4-mini-flash-reasoning 边缘设备AI模型轻量级AI模型单GPU运行AI模型 Phi-4系列性能优化

2025-07-12 11:19:33 274人关注

无需CUDA代码！H100加速提升33%-50%，Flash Attention作者新作引发热议

据最新报道，Flash Attention 的共同作者 Tri Dao 与普林斯顿大学的两位博士生联合推出了一个名为 QuACK 的新内核库，令人瞩目的是，他们仅使用 Python 和 CuTe-DSL 开发，完全没有涉及 CUDA C++ 代码。这一创新不仅打破了传统的编程框架，还在强大的 H100显卡上实现了比 PyTorch 中的 torch.compile 和 Liger 等库快33%-50% 的速度提升。

Flash Attention QuACK 内核库 Python 和 CuTe-DSL 开发 GPU 加速库 H100 显卡性能优化 AI 模型加速技术

2025-07-07 17:21:43 404人关注

英伟达收购AI初创公司CentML，95后华人团队再创辉煌

最近，英伟达以4亿美元的价格收购了位于多伦多的 AI 初创公司 CentML，这家由95后华人王尚和其导师共同创立的公司专注于优化 AI 应用程序的性能。王尚作为首席技术官，此次不仅带领自己创立的团队重返英伟达，还为英伟达的 CUDA 工具链注入了新动力。

英伟达收购CentML AI性能优化华人创业者王尚 CUDA工具链优化 AI初创公司收购案例

2025-06-09 10:28:18 523人关注

搜狗输入法推出AI汪仔“快捷搜索”功能：接入混元快思考模型Turbo S

近日，搜狗输入法Windows版迎来重大升级，全新推出AI汪仔“快捷搜索”功能，为用户带来了更高效便捷的办公学习体验。

搜狗输入法AI汪仔Turbo AI输入法升级智能输入技术搜狗AI技术应用输入法性能优化

2025-06-08 16:43:15 263人关注

秘塔AI搜索全新 “极速” 模型上线，实现400 tokens /秒极速响应

秘塔 AI 搜索推出了全新的 “极速” 模型，标志着其在人工智能搜索技术上的重大突破。通过创新的技术手段，秘塔 AI 搜索的响应速度达到了令人惊叹的400tokens / 秒，确保大部分问题在2秒内就能得到答案。这一进步不仅提升了用户体验，也显著提高了信息获取的效率。

MetaSeek AI搜索 AI搜索技术 400 tokens处理速度 AI搜索性能优化大模型搜索应用

2025-06-08 10:36:27 246人关注

Chrome v137 开发者工具重磅升级 Gemini 智能标注让性能分析秒变神器！

Google 近日发布了 Chrome v137开发者工具（Chrome DevTools）的重大更新，集成了 Gemini AI 智能助手，为开发者带来前所未有的性能分析和调试体验。从智能标注性能追踪到 CSS 修改保存，Chrome v137的新功能极大提升了开发效率。AIbase 综合整理最新信息，为您详细解析此次更新的亮点与应用前景。

Chrome v137 开发者工具 Gemini性能优化浏览器开发工具更新 Chrome性能分析

2025-06-07 08:16:16 260人关注

GPT-4.5发布：价格飙升30倍能力提升引发热议

2025 年 2 月 27 日，OpenAI正式发布了其最新聊天模型GPT-4.5，这一消息迅速在Twitter（现为X平台）上引发了广泛讨论。作为OpenAI迄今为止最强大的对话模型，GPT-4. 5 在性能上实现了显著突破，但其高昂的价格也让用户和开发者们议论纷纷。与此同时，业内人士针对其能力与现有模型的对比展开了激烈争论。

GPT-4.5价格 GPT-4.5能力提升 GPT-4.5涨价原因 GPT-4.5性能优化 GPT-4.5最新消息

2025-05-31 16:28:40 194人关注

研究人员揭示大模型并非真正推理，只是在 “找关系”

随着人工智能（AI）技术的飞速发展，越来越多的研究人员开始对大型语言模型(如 ChatGPT)进行深入探讨。近日，亚利桑那州立大学的研究小组在预印本平台 arXiv 上发表了一项引人关注的论文，指出我们对这些 AI 模型的理解可能存在误区。他们认为，这些模型实际上并不会进行真正的思考或推理，而仅仅是在寻找相关性。

模型推理能力 AI模型推理研究模型推理技术 AI推理模型评估模型推理性能优化

2025-05-29 16:31:34 706人关注

可灵2.1重磅上线:价格降65%，性能显著提升

备受关注的 AI 视频生成工具可灵2.1正式上线。这次更新不仅在性能上实现了显著提升，还大幅降低了价格，吸引了众多用户的目光。根据反馈，可灵2.1的效果、速度与性价比都令人惊艳，用户普遍表示这款新版本将大大改善他们的创作体验。

cooling-21发布价格下调性能提升冷却技术新闻产品降价与性能优化

2025-05-19 18:15:29 202人关注

Claude 3.7 Sonnet登陆Perplexity Pro，带来性能新提升

2025年2月24日，Perplexity 平台宣布支持新的 AI 模型 Claude3.7Sonnet （Anthropic 发布 Claude3.7Sonnet）。官方 X 帖子称，该模型已进行内部测试一段时间，观察到代理工作流程和代码生成的显著改进。

Claude 3.7 Claude 3.7 Sonnet Perplexity Pro 性能提升大模型性能优化

2025-04-21 16:15:23 298人关注

谷歌发布 Gemma 3 QAT 模型：一张3090显卡也能轻松驾驭

谷歌近期推出了 Gemma3系列的全新版本，这一消息让众多 AI 爱好者为之振奋。仅在上线一个月后，谷歌便发布了经过量化感知训练（QAT）优化的 Gemma3，旨在显著降低内存需求的同时，保持模型的高质量。

Google Gemma 3 QAT（量化感知训练） RTX 3090 训练优化大模型量化技术 Google Gemma 3 性能优化

2025-04-20 10:15:22 486人关注

AMD显卡性能飞跃！Stable Diffusion 模型迎来优化大提升

AMD 在 AI 领域的进展值得关注，尤其是其最新发布的针对 Stable Diffusion 模型的优化。近日，Stability AI 推出了基于 ONNX 框架优化的 Stable Diffusion 版本，这意味着 AMD 的 Radeon 显卡和锐龙集显在运行 AI 任务时性能提升显著，最高可达3.8倍。这一进展不仅缩小了与 NVIDIA 在生态系统优化方面的差距，也为 AMD 用户带来了实实在在的好处。

AMD GPU性能提升 Stable Diffusion优化 AMD显卡优化 Stable Diffusion性能优化 AMD GPU深度学习优化

2025-04-07 10:31:39 260人关注

Meta被指AI模型"双标":评测版与公开版Maverick表现大相径庭

Meta周六发布了其新旗舰AI模型Maverick，该模型在LM Arena评测中排名第二。LM Arena是一项依靠人类评分者比较不同模型输出并选择偏好的测试平台。然而，多位AI研究人员很快发现，Meta部署到LM Arena的Maverick版本似乎与开发人员广泛使用的版本存在显著差异。

Meta AI模型 Maverick性能差异 AI模型性能对比 Meta AI技术解析大模型性能优化

2025-04-05 14:39:28 252人关注

研究警告AI语言模型极限:超8K上下文性能腰斩，概念推理成难关

慕尼黑大学、慕尼黑机器学习中心与Adobe Research近日联合发布的研究显示，包括GPT-4o、Gemini1.5Pro和Llama-3.3-70B在内的12款顶尖AI语言模型，在长文本概念推理任务中面临显著性能衰减。尽管这些模型均支持至少128，000个标记的上下文处理，但其深层逻辑关联能力仍存在根本性局限。

AI语言模型上下文性能概念推理 AI模型性能优化语言模型技术原理

2025-04-03 16:12:22 349人关注

OpenAI o3 模型运行成本飙升：单次任务费用从 3000 美元涨至 30000 美元

近日，Arc Prize Foundation 对 OpenAI 的 o3“推理” 人工智能模型的运行成本进行了大幅度修订，令人瞩目的是，单次任务的费用从最初的3000美元骤升至30000美元。这一变化让许多人意识到，最先进的 AI 模型在执行特定任务时所需的高昂费用，已成为行业一个不容忽视的挑战。

OpenAI O3模型 OpenAI模型成本上涨 AI大模型成本分析 OpenAI价格调整 O3模型性能优化

2025-04-02 14:35:40 305人关注

LangChain 研究揭示AI代理在工具使用上面临瓶颈

随着人工智能（AI）技术的不断进步，企业开始探讨是否应该依赖单一的 AI 代理，还是构建一个涵盖更多职能的多代理网络。近日，Orchestration 框架公司 LangChain 进行了相关实验，旨在探讨 AI 代理在面对过多指令和工具时的表现极限。

LangChain研究 AI Agents工具瓶颈 AI代理技术瓶颈 LangChain技术解析 AI工具性能优化

2025-03-20 16:24:39 290人关注

谷歌开源新一代多模态模型 Gemma-3：性能卓越、成本降低 10 倍

谷歌 CEO 桑达尔・皮查伊（Sundar Pichai）在一场发布会上宣布，谷歌开源了最新的多模态大模型 Gemma-3，该模型以低成本、高性能为特点，备受关注。

Google Gemma 3 多模态模型模型性能优化成本效益分析 Gemma 3应用场景

- 上云资讯 -

上海交大发布 MobiAgent：人人都能拥有自己的 AI 助手，超越 GPT-5！

Roblox推出类TikTok短视频功能提升创作者收益并发布多项AI工具

苹果重磅开源FastVLM与MobileCLIP2：85倍速度飙升，iPhone秒变AI神器！

微软全新 Phi-4-mini 版发布：推理效率提升 10 倍，轻松适配笔记本

无需CUDA代码！H100加速提升33%-50%，Flash Attention作者新作引发热议

英伟达收购AI初创公司CentML，95后华人团队再创辉煌

搜狗输入法推出AI汪仔“快捷搜索”功能：接入混元快思考模型Turbo S

秘塔AI搜索全新 “极速” 模型上线，实现400 tokens /秒极速响应

Chrome v137 开发者工具重磅升级 Gemini 智能标注让性能分析秒变神器！

GPT-4.5发布：价格飙升30倍能力提升引发热议

研究人员揭示大模型并非真正推理，只是在 “找关系”

可灵2.1重磅上线:价格降65%，性能显著提升

Claude 3.7 Sonnet登陆Perplexity Pro，带来性能新提升

谷歌发布 Gemma 3 QAT 模型：一张3090显卡也能轻松驾驭

AMD显卡性能飞跃！Stable Diffusion 模型迎来优化大提升

Meta被指AI模型"双标":评测版与公开版Maverick表现大相径庭

研究警告AI语言模型极限:超8K上下文性能腰斩，概念推理成难关

OpenAI o3 模型运行成本飙升：单次任务费用从 3000 美元涨至 30000 美元

LangChain 研究揭示AI代理在工具使用上面临瓶颈

谷歌开源新一代多模态模型 Gemma-3：性能卓越、成本降低 10 倍

推荐阅读

上云服务

- 上云资讯 -

上海交大发布 MobiAgent：人人都能拥有自己的 AI 助手，超越 GPT-5！

Roblox推出类TikTok短视频功能 提升创作者收益并发布多项AI工具

苹果重磅开源FastVLM与MobileCLIP2：85倍速度飙升，iPhone秒变AI神器！

​微软全新 Phi-4-mini 版发布：推理效率提升 10 倍，轻松适配笔记本

无需CUDA代码！H100加速提升33%-50%，Flash Attention作者新作引发热议

英伟达收购AI初创公司CentML，95后华人团队再创辉煌

搜狗输入法推出AI汪仔“快捷搜索”功能：接入混元快思考模型Turbo S

秘塔AI搜索​全新 “极速” 模型上线，实现400 tokens /秒极速响应

Chrome v137 开发者工具重磅升级 Gemini 智能标注让性能分析秒变神器！

GPT-4.5发布：价格飙升30倍 能力提升引发热议

研究人员揭示大模型并非真正推理，只是在 “找关系”

可灵2.1重磅上线:价格降65%，性能显著提升

Claude 3.7 Sonnet登陆Perplexity Pro，带来性能新提升

谷歌发布 Gemma 3 QAT 模型：一张3090显卡也能轻松驾驭

AMD显卡性能飞跃！Stable Diffusion 模型迎来优化大提升

Meta被指AI模型"双标":评测版与公开版Maverick表现大相径庭

研究警告AI语言模型极限:超8K上下文性能腰斩，概念推理成难关

OpenAI o3 模型运行成本飙升：单次任务费用从 3000 美元涨至 30000 美元

LangChain 研究揭示AI代理在工具使用上面临瓶颈

​谷歌开源新一代多模态模型 Gemma-3：性能卓越、成本降低 10 倍

推荐阅读

上云服务

Roblox推出类TikTok短视频功能提升创作者收益并发布多项AI工具

微软全新 Phi-4-mini 版发布：推理效率提升 10 倍，轻松适配笔记本

秘塔AI搜索全新 “极速” 模型上线，实现400 tokens /秒极速响应

GPT-4.5发布：价格飙升30倍能力提升引发热议

谷歌开源新一代多模态模型 Gemma-3：性能卓越、成本降低 10 倍