- 上云资讯 -
2025-10-28 11:42:23 109人关注
每周百万用户向ChatGPT倾诉自杀念头,OpenAI紧急升级GPT-5安全机制应对心理危机
当AI成为数亿人深夜唯一的倾诉对象,它是否准备好承担这份沉重的信任?OpenAI近日披露了一组令人警醒的数据:每周有超过100万活跃用户在与ChatGPT的对话中表达自杀意图——这一数字占其8亿周活用户的0.15%,相当于每分钟就有近100人向AI袒露生死挣扎。此外,数十万用户在交互中显现出精神病性或躁狂症状,揭示出AI聊天机器人正意外成为全球规模最大的“非正式心理支持渠道”。
2025-10-24 10:17:37 263人关注
Kimi k2性能被赞超越 GPT-5,月之暗面再获数亿美元重磅融资
据ZFinance消息, 国内大模型明星创业公司月之暗面(Moonshot AI)近日传出重磅消息,据 ZF 获悉,该公司即将完成新一轮数亿美元的融资。此次融资距离月之暗面公开披露的上一轮约3亿美元融资仅过去不久(上一次公开信息为2024年8月),显示出资本市场对该公司的信心再次高涨。
2025-10-22 15:30:45 8人关注
惊爆!Vercel CEO 称 Kimi K2 在 AI 应用中超越 GPT-5,准确率高出 50%!
近日,美国初创公司 Vercel 的首席执行官吉列尔莫在社交媒体上发布了一项引人注目的声明,称中国开源模型 Kimi K2在智能体应用场景中的表现远超其对手,包括前沿的闭源模型 GPT-5和 Claude Sonnet4.5。根据吉列尔莫的分享,Kimi K2不仅在准确率上领先了50%,而且运行速度更是快了整整5倍,这一发现引发了科技界的广泛关注。
2025-10-20 11:23:23 121人关注
OpenAI GPT-5 被指数学成就夸大,引发科技界热议
近日,OpenAI 的 GPT-5在数学领域的宣称引发了广泛的争议。Meta 的首席 AI 科学家 Yann LeCun 形容此次事件为 “自作自受”,而 Google DeepMind 的 CEO Demis Hassabis 则表示 “这太尴尬了”。
2025-10-15 15:27:16 0人关注
GPT-5 Pro找回被遗忘的数学答案:埃尔德什问题#339早在2003年已被证明
一道被认为悬而未决的数学难题,竟然在22年前就已经有了答案。近日,OpenAI的最新AI模型GPT-5Pro通过一张问题截图,成功定位到了埃尔德什问题#339在2003年就已发表的证明论文,这一发现让数学界惊讶不已。
2025-10-13 10:10:29 367人关注
蚂蚁集团发布万亿参数模型 Ling-1T,超越 GPT-5 成新标杆
蚂蚁集团近日宣布,开源了其最新研发的旗舰大模型 ——Ling-1T,该模型拥有高达万亿个参数,是目前已知使用 FP8低精度模式训练的最大基座模型。Ling-1T 由蚂蚁内部的 “百灵” 团队开发,标志着人工智能技术的又一次突破。
2025-10-12 18:32:29 96人关注
OpenAI重磅发布GPT-5 Pro API,智能化未来一触即发
近日,OpenAI 正式推出了其最新的 GPT-5 Pro API,标志着人工智能领域的一次重大升级。这一新模型被认为是 OpenAI 迄今为止最强大的产品,拥有令人瞩目的 40 万 Token 上下文窗口。这意味着它能够处理更为复杂和长篇的文本,同时也支持图像输入,进一步扩展了其应用场景。
2025-10-12 14:37:37 262人关注
GPT-5偏见测试结果公布:500问验证客观性飞跃,情感化问题仍是挑战
OpenAI最新向Axios披露的研究成果显示,刚刚发布的GPT-5模型在政治偏见控制方面取得突破性进展,偏见水平较前代产品降低30%。
2025-10-12 13:43:36 265人关注
陶哲轩携手GPT-5 Pro攻克微分几何难题:AI用11分钟完成证明,数学研究迎来新范式
数学研究正在迎来一场AI革命。著名华裔数学家陶哲轩近日与AI模型GPT-5Pro合作,成功解决了一个困扰学界三年的微分几何难题。这次跨界协作不仅展示了AI在数学研究中的巨大潜力,也为人机协同探索复杂问题提供了新的范本。
2025-10-11 08:24:30 460人关注
OpenAI新研究称GPT-5为迄今“政治偏见最少”的AI模型
根据 OpenAI 的最新研究,刚刚发布的 GPT-5模型在政治偏见方面的表现远远优于以往的同类产品。这一研究成果由 OpenAI 团队向 Axios 披露,标志着 AI 模型在偏见控制方面的重要进展。
2025-10-07 08:18:31 257人关注
OpenAI“Codex Alpha”抢先体验!七层级新模型曝光,GPT-5编程能力大升级
科技媒体 BleepingComputer 报道,OpenAI 已为其 AI 编程助手 Codex 推出名为 “Codex Alpha” 的抢先体验计划,邀请开发者和用户在下周的 2025年度开发者日(DevDay2025) 正式发布前,提前试用最新的 Codex 模型和功能。
2025-09-30 18:40:28 155人关注
蚂蚁集团开源全球首个万亿参数大模型 Ring-1T-preview,代码生成能力超越 GPT-5
近日,蚂蚁集团宣布开源其自研的万亿参数推理大模型 Ring-1T-preview,这一模型成为全球首个开源的万亿参数推理大模型。虽然目前仅为预览版,Ring-1T-preview 在自然语言推理方面表现出色,多个测试的结果显示其能力令人瞩目。
2025-09-30 10:20:21 215人关注
Anthropic放大招!Claude Sonnet4.5碾压GPT-5,编码界“新王者”诞生
Anthropic最新发布了Claude Sonnet4.5模型,这款备受期待的AI模型于9月29日正式亮相,被誉为“世界上最佳编码模型”,标志着AI在复杂任务处理和自主代理领域的重大突破。以下是基于最新数据的专业剖析。
2025-09-29 14:11:45 267人关注
Moondream3.0发布,多项基准测试超越了 GPT-5 等顶尖模型
在最新发布的 Moondream3.0预览版中,这款以高效混合专家(MoE)架构为基础的模型展示了令人惊叹的视觉推理能力。Moondream3.0拥有总共9亿参数,但仅激活2亿参数的轻量化设计,使其在复杂场景中的表现尤为突出。与之前的 Moondream2版本相比,3.0在多项基准测试中超越了如 GPT-5、Gemini 和 Claude4等业内顶尖模型,真正实现了技术的飞跃。
2025-09-28 16:15:21 339人关注
小型VLM黑马逆袭:Moondream 3.0仅2B激活参数,碾压GPT-5和Claude 4
在视觉语言模型(VLM)领域,一场“小而美”的革命正在上演。最新发布的Moondream3.0(预览版)以其高效的混合专家(MoE)架构,凭借总9B参数、激活仅2B的轻量设计,实现了前沿级视觉推理能力。这一升级版模型不仅在复杂场景下表现出色,甚至在多项基准测试中超越了GPT-5、Gemini和Claude4等头部模型,引发AI社区热议。相较于今年1-2月推出的Moondream2版本(擅长验证码识别),3.0版扩展了应用边界,支持32K上下文长度,适用于实时交互和代理工作流。
2025-09-27 11:15:18 51人关注
OpenAI 最新基准测试显示 GPT-5 在多个行业中逐渐逼近人类专家
近日,OpenAI 推出了一项新的基准测试,旨在评估其人工智能模型在各行业与人类专业人士的表现差异。这项名为 GDPval 的测试,是 OpenAI 对其人工智能系统在经济价值工作中是否能超越人类的重要探索。根据 OpenAI 的说法,GPT-5模型与 Anthropic 的 Claude Opus4.1模型在某些领域的工作质量已经接近行业专家。
2025-09-26 13:28:29 174人关注
GPT-5震撼突破:首次通过哥德尔测试,破解三大数学猜想!
近日,OpenAI 的 GPT-5取得了一项惊人的成就 —— 它首次通过了哥德尔测试,并成功破解了三大组合优化领域的数学猜想。这一突破不仅令 OpenAI 的研究科学家们感到惊讶,也为人工智能在数学研究中的潜力打开了新的大门。
2025-09-25 09:10:24 236人关注
OpenAI 发布革命性 GPT-5-Codex 模型,编程未来触手可及
OpenAI正式推出其最新的 GPT-5-Codex 模型 API。这一新模型与其前身 GPT-5在定价上保持一致,使用者可以以每百万个输入 token 收费1.25美元,以及每百万个输出 token 收费10美元的方式体验到这一强大工具的魅力。
2025-09-23 13:11:23 6人关注
AI三巨头惨遭滑铁卢:最新编程测试正确率全线跌破25%,GPT-5也难逃厄运
AI界的三大巨头正在经历一场前所未有的挫败。当GPT-5、Claude Opus4.1和Gemini2.5这些被誉为人工智能皇冠上明珠的模型,面对Scale AI全新推出的SWE-BENCH PRO编程测评时,竟然全军覆没,没有一个模型能够突破25%的解决率大关。
2025-09-16 10:20:41 236人关注
OpenAI重磅推出GPT-5-Codex:AI编码代理将彻底颠覆开发者世界
OpenAI近日正式发布GPT-5-Codex,这是一款基于GPT-5进一步优化的版本,专为代理式编码(agentic coding)量身定制。该模型标志着AI从辅助工具向自主“编程伙伴”的重大跃进,将极大提升软件开发效率。根据最新信息整理,该发布于2025年9月15日迅速引发全球科技圈热议,开发者反馈显示其在复杂任务处理上表现出色,已成为Codex平台流量主力。
