- 上云资讯 -
2025-07-31 17:45:27 38人关注
阿里WebShaper发布!GAIA碾压Claude 3.5 Sonnet、GPT-4o
阿里通义实验室(Tongyi Lab)近日重磅推出WebAgent系列的第四款开源工具——WebShaper,这一突破性框架以其创新的“形式化驱动”信息检索范式引发行业热议。据AIbase从社交媒体及相关渠道获悉,WebShaper不仅在GAIA基准测试中取得60.19的高分,超越了Claude3.5Sonnet和GPT-4o,还通过全新的数据生成方法显著提升了AI在复杂任务中的信息检索与推理能力。
阿里通义实验室 WebAgent系列开源工具 WebShaper框架 形式化驱动信息检索 GAIA基准测试高分 AI复杂任务推理能力
2025-07-30 12:28:42 52人关注
谷歌悄然升级Imagen 4!碾压GPT-4o,AI图像生成王者归来?
近日,谷歌对其文本转图像生成模型Imagen4进行了重大升级,引发了人工智能领域的广泛关注。据最新消息,升级后的Imagen4Ultra在权威的Artificial Analysis图像竞技场排行榜中一举跃升至第三位,与OpenAI的GPT-4o和Seedream3.0并肩,成为全球顶尖的图像生成模型之一。
谷歌Imagen4升级 Imagen4Ultra模型 图像生成模型排名 Artificial Analysis排行榜 顶尖AI图像生成技术
2025-07-25 12:33:42 68人关注
阿里通义千问AI编程大模型Qwen3-Coder登顶榜首
在7月24日,全球最大的 AI 开源社区 Hugging Face 发布了最新的大模型排行榜,令人瞩目的阿里巴巴 Qwen3-Coder 成功登顶,成为全球热度最高的开源 AI 编程模型,甚至超越了备受瞩目的 GPT-4.1和 Claude4。
Hugging Face 大模型排行榜 阿里巴巴 Qwen3-Coder 开源 AI 编程模型 GPT-4.1 对比 Qwen3-Coder Claude4 与 Qwen3-Coder 性能比较 全球 AI 编程模型热度排名
2025-07-21 14:20:21 44人关注
大语言模型的自信危机:为何GPT-4o轻易放弃正确答案?
最近,Google DeepMind 与伦敦大学的研究揭示了大语言模型(LLMs)在面对反对意见时的 “软弱” 表现。比如,像 GPT-4o 这样的先进模型,有时会显得非常自信,但一旦遇到质疑,它们就可能立即放弃正确答案。这种现象引发了研究人员的关注,他们探索了这种行为背后的原因。
大语言模型行为研究 LLMs 面对质疑表现 GPT-4o 自信度分析 语言模型软弱性原因 Google DeepMind 最新发现
2025-07-17 08:44:45 209人关注
Kimi-2 已上线 LiveBench AI:超越 GPT-4.1,开源 AI 新王者诞生
近日,人工智能领域迎来了一项重要进展——Kimi-2 正式在 LiveBench AI 平台上线,并计划于次日在 ChatLLM 平台推出。这一消息迅速在业内引发广泛关注,Kimi-2以其卓越的性能和开源特性被认为是 AI 模型发展中的重要里程碑。以下是 AIbase 整理的关于 Kimi-2的最新动态和关键信息。
2025-07-02 16:34:22 79人关注
OpenAI 启动高端企业 AI 咨询服务 客户收费至少 1000 万美元
据 The Information 报道,OpenAI 正在加大其企业 AI 咨询业务的力度,收费标准至少为每位客户1000万美元。公司工程师直接与各组织合作,调整如 GPT-4o 等模型以适应其特定数据,并构建定制应用程序,包括聊天机器人等。这一举措使 OpenAI 与诸如 Palantir 和 Accenture 等知名企业展开直接竞争。
OpenAI企业AI咨询 GPT-4o定制应用 AI咨询收费标准 OpenAI与Palantir竞争 企业AI解决方案定制 OpenAI工程师服务
2025-06-30 17:33:34 71人关注
新开源 AI 系统 OmniGen 2:像GPT-4o 一样融合了图像和文本生成
近日,北京人工智能研究院推出了全新的开源系统 ——OmniGen2。这一系统专注于文本到图像的生成、图像编辑和上下文图像创作。
2025-06-27 10:32:44 175人关注
开源神器来了!FLUX.1 Kontext [dev]挑战GPT-4o,图像编辑进入新时代
近日,Black Forest Labs宣布正式开源其最新图像编辑模型FLUX.1Kontext [dev],这一拥有120亿参数的AI模型被誉为对标OpenAI GPT-4o和Google Gemini的强力竞争者。据AIbase了解,该模型专为图像编辑任务设计,兼具高性能与易用性,不仅能在消费级硬件上高效运行,还为用户提供了前所未有的图像编辑体验。
AI大模型 开源图像编辑模型 FLUX.1Kontext dev 120亿参数AI模型 Black Forest Labs开源项目 消费级硬件AI模型
2025-06-27 10:27:24 87人关注
Black Forest震撼开源FLUX.1 Kontext [dev]:媲美GPT-4o的图像编辑
Black Forest Labs正式宣布,其全新图像编辑模型 FLUX.1Kontext [dev] 现已开源,引发了AI社区的广泛关注。
AI图像编辑模型 FLUX.1Kontext开源 Black Forest Labs新技术 AI社区热点 图像处理AI模型
2025-06-24 11:19:20 71人关注
AI 逆袭:大型语言模型助力癌症新药研发,竟然能 “发明” 疗法!
近日,一项来自剑桥大学等机构的研究成果引发了广泛关注:大型语言模型(LLMs)不仅在自然语言处理领域崭露头角,还能为癌症治疗带来新的希望。研究人员利用 GPT-4模型,首次尝试将其作为科学假说的生成工具,在乳腺癌的药物研发上取得了令人振奋的进展。
2025-06-19 16:22:41 295人关注
OpenAI 宣布:2025 年 GPT-4.5 API 服务将停用,开发者面临转型挑战!
近日,OpenAI 正式宣布,将于 2025 年 7 月 14 日终止 GPT-4.5 预览版 API 服务。这一决定将对使用该服务的第三方开发者产生重大影响,尽管个人版的 ChatGPT 用户将不受影响。开发者们需在短短三个月内将自己的应用迁移到其他模型,以确保业务的持续运行。
OpenAI GPT-4.5 API终止 GPT-4.5 API迁移指南 OpenAI API服务变更 第三方开发者影响 AI模型迁移策略 GPT-4.5替代方案
2025-06-08 16:37:43 200人关注
美团 AI 业务进展:基础大模型能力接近 GPT-4o 水平
在美团2025年第一季度财报电话会上,美团创始人王兴披露了公司在人工智能(AI)领域的最新进展。他表示,美团正在加速推进 AI 大模型的研发,其基础模型能力已经接近 GPT-4o 的水平。王兴强调,这项技术将为商家带来更大的便利,助力数字化转型。
2025-06-07 08:16:16 81人关注
GPT-4.5发布:价格飙升30倍 能力提升引发热议
2025 年 2 月 27 日,OpenAI正式发布了其最新聊天模型GPT-4.5,这一消息迅速在Twitter(现为X平台)上引发了广泛讨论。作为OpenAI迄今为止最强大的对话模型,GPT-4. 5 在性能上实现了显著突破,但其高昂的价格也让用户和开发者们议论纷纷。与此同时,业内人士针对其能力与现有模型的对比展开了激烈争论。
2025-06-06 18:45:39 199人关注
GPT-4.5正式亮相:OpenAI推出迄今最强大聊天模型
OpenAI今日宣布,其最新聊天模型GPT-4.5正式进入研究预览阶段。这一模型被誉为OpenAI迄今为止“最大且最佳”的聊天AI,并已开始向ChatGPT Pro用户逐步推出。根据官方声明,GPT-4.5将在下周扩展至Plus和Team用户,随后于下下周覆盖Enterprise和Edu用户。这一发布标志着OpenAI在AI技术领域的又一重大突破,引发了业界和社交媒体的广泛热议。
2025-06-06 14:41:24 530人关注
OpenAI 发布 GPT-4.5:迄今最强大模型亮相 强化推理与情感智能
2025年2月27日—— OpenAI 于今日正式推出其最新语言模型 GPT-4.5,作为研究预览版率先提供给 ChatGPT Pro 用户(每月订阅费200美元)。这款被誉为“迄今为止最大、最知识渊博”的模型基于 GPT-4o 构建,在推理能力、情感智能以及写作、编程等实用功能上实现显著提升。OpenAI 表示,未来几周内,GPT-4.5将逐步开放给 Plus、Team、Enterprise 和 Edu 用户,标志着人工智能技术的又一里程碑。
2025-06-06 12:34:33 96人关注
解读OpenAI GPT-4.5 系统卡报告
OpenAI 于2025年2月27日发布的 GPT-4.5系统卡报告(https://cdn.openai.com/gpt-4-5-system-card.pdf)的详细解读。该报告全面介绍了 GPT-4.5模型的开发、能力、安全评估及准备框架评估,旨在展示其进步与潜在风险,并阐述 OpenAI 的应对措施。以下解读按照报告的主要部分展开:
2025-06-06 10:36:41 87人关注
OpenAI正式发布GPT-4.5 率先向ChatGPT Pro用户开放
2月28日,OpenAI通过官方博文宣布,其最新研发的GPT-4.5AI模型已正式亮相。这款模型被OpenAI标榜为其目前最大、表现最佳的聊天模型,并将以研究预览版的身份率先向ChatGPT Pro用户开放体验。
2025-06-03 10:29:40 87人关注
发布在即?OpenAI GPT-4.5出现在Android应用测试版
最近,OpenAI 正在为其新一代语言模型 GPT-4.5的预览版做准备,这一消息引发了广泛关注。根据发现,这一开发成果出现在 ChatGPT 的 Android 应用程序中,作为一个已宣布的实验性选项,尽管目前还无法访问。根据最新通知,GPT-4.5最初将专门向 Pro 订阅用户提供。