- 上云资讯 -
2025-07-07 17:21:43 106人关注
英伟达收购AI初创公司CentML,95后华人团队再创辉煌
最近,英伟达以4亿美元的价格收购了位于多伦多的 AI 初创公司 CentML,这家由95后华人王尚和其导师共同创立的公司专注于优化 AI 应用程序的性能。王尚作为首席技术官,此次不仅带领自己创立的团队重返英伟达,还为英伟达的 CUDA 工具链注入了新动力。
2025-06-10 10:40:30 87人关注
红杉中国推出全新 AI 基准测试工具,助力智能体评估新标准
随着人工智能技术的迅速发展,尤其是大型模型的不断进步,基准测试在评估 AI 能力时面临着前所未有的挑战。为了应对这一现状,红杉中国于5月26日宣布推出一款全新的 AI 基准测试工具 ——xbench。这款工具不仅是针对 AI 模型能力的评估,还引入了动态更新机制,确保测试的有效性和公正性。
2025-05-23 08:42:17 53人关注
英特尔发布 Xeon 6 处理器:AI 处理性能提升两倍
英特尔近期推出了新一代 Xeon6处理器,采用性能核心设计,旨在提升数据中心工作负载的整体性能,并在人工智能(AI)处理方面实现高达两倍的性能提升。这次发布标志着英特尔在全球半导体市场中的重要一步,尤其是在公司经历了 CEO 更换与市场竞争压力之后。
Intel Xeon 6处理器 AI性能 Intel Xeon 6 AI性能 Intel Xeon 6处理器评测 Intel Xeon 6处理器性能分析
2025-05-06 08:34:17 81人关注
OpenAI最新基准测试:AI编程能力达人类四分之一,显现局限性
OpenAI近日发布了一项重要的AI编程能力评估报告,通过价值100万美元的实际开发项目揭示了AI在软件开发领域的现状。这项名为SWE-Lancer的基准测试涵盖了1,400个来自Upwork的真实项目,全面评估AI在直接开发和项目管理两大领域的表现。
2025-04-03 16:15:26 260人关注
Gemini-2.5-pro在MathArena评测中展现卓越数学能力 远超其他模型
2025年4月3日消息:根据MathArena最新发布的大语言模型数学能力评测结果显示,Google的Gemini-2.5-pro以绝对优势领跑,在未污染的高难度数学竞赛中展现出令人瞩目的表现。
2025-02-08 10:11:42 146人关注
DeepMind 新AI系统超越国际数学奥林匹克金牌选手,解题能力显著提升
近日,谷歌 DeepMind 开发的一款 AI 系统 ——AlphaGeometry2,成功超越了国际数学奥林匹克(IMO)金牌选手的平均水平,在几何问题解答上表现优异。AlphaGeometry2是 DeepMind 在去年发布的 AlphaGeometry 系统的升级版,研究团队在最新的研究中指出,该系统能解决过去25年间 IMO 的84% 几何问题。
2025-01-28 09:23:28 125人关注
AI 在高级历史考试中表现不佳:GPT-4 Turbo 准确率仅 46%
近日,一项由奥地利复杂科学研究所(CSH)主导的研究显示,尽管大型语言模型(LLMs)在多项任务中表现优异,但在应对高级历史问题时却暴露了短板。研究团队针对三大顶尖模型进行测试,包括 OpenAI 的 GPT-4、Meta 的 Llama 和谷歌的 Gemini,结果让人失望。
2025-01-22 17:19:20 82人关注
英伟达发布生成式AI超级电脑:仅249美元 性能提升1.7倍
英伟达近日推出了一款名为Jetson Orin Nano Super的生成式人工智能(AI)超级电脑,专为开发者设计,以更亲民的价格提供性能飞跃。该设备定价为249美元,约合人民币1814元,其生成式AI性能提升了1.7倍。与前代产品相比,Jetson Orin Nano Super实现了70%的性能提升,每秒能执行67兆次INT8运算,即67INT8TOPS,同时内存带宽提升了50%,达到102GB/s。
NVIDIA生成式AI超级计算机 生成式AI性能提升 AI超级计算机性能对比 NVIDIA AI硬件优化 高性能AI计算解决方案
2025-01-21 21:37:30 133人关注
阿里推新 AI 基准测试 “PROCESSBENCH”,评估数学推理中的错误识别能力
近日,阿里巴巴 Qwen 团队的研究人员推出了一个名为 “PROCESSBENCH” 的新基准测试,旨在衡量语言模型在数学推理中识别过程错误的能力。随着语言模型在复杂推理任务中取得显著进展,这一领域的研究者们发现,尽管模型表现出色,但在处理某些困难问题时依然面临挑战。因此,开发一种有效的监督方法显得尤为重要。
2025-01-21 10:37:28 291人关注
国产大模型再突破!DeepSeek R1开源,性能直逼OpenAI,开启AI平权新时代
DeepSeek近日正式发布并开源了其最新研发的大型语言模型R1,该模型在性能上表现出色,被认为可与OpenAI的o1正式版相媲美。这一举措不仅标志着国产AI技术的又一次重大突破,也为全球AI开发者带来了新的选择。
2025-01-19 02:25:17 140人关注
谷歌开源轻量级语言模型Gemina 2:提升AI性能、速度和可访问性
谷歌推出了 Gemma2,这是其开源轻量级语言模型的最新版本,提供90亿 (9B) 和270亿 (27B) 参数大小。与前身 Gemma 模型相比,这个新版本承诺增强性能和更快的推理速度。
2025-01-16 13:29:21 198人关注
Groq开源的Llama AI模型登顶排行榜,函数调用方面优于GPT-4o和Claude
人工智能硬件初创公司Groq发布了两款开源语言模型,这两款模型在专门工具使用能力方面胜过科技巨头。新的 Llama-3-Groq-70B-Tool-Use 模型已经在伯克利函数调用排行榜(BFCL)上夺得榜首,超越了来自 OpenAI、谷歌和 Anthropic 等公司的专有产品。
2025-01-15 15:39:17 112人关注
英特尔推出AI Playground测试版 为Arc显卡用户开启AI新体验
英特尔近日宣布,面向Arc显卡用户开放其AI开源软件AI Playground的测试版。这一举措标志着英特尔在人工智能领域的又一重要布局,为用户提供了探索和利用AI技术的新平台。
Intel AI Playground Arc Graphics AI大模型应用 Intel显卡AI性能 AI技术实践案例
2025-01-10 02:15:25 197人关注
Geekbench推出AI性能测试工具:设备AI能力评估迎来新标准
知名基准测试工具Geekbench推出了一款全新的跨平台工具,旨在评估设备在AI密集型工作负载下的性能表现。这款名为Geekbench AI的工具通过测试设备的CPU、GPU和NPU(神经网络处理器)性能,来判断其处理机器学习应用的能力。
2025-01-07 12:29:42 106人关注
用户抱怨Claude性能下降 Anthropic否认做出任何改变
近日,Anthropic公司的AI聊天机器人Claude再次陷入性能争议。Reddit上一篇声称"Claude最近变得愚蠢多了"的帖子引发广泛关注,许多用户表示感受到Claude能力下降,包括记忆力减退和编码能力下滑。
2025-01-07 12:25:13 101人关注
谷歌突发大招!Gemini 1.5系列新模型震撼登场,性能飙升引爆AI圈
谷歌再次引领人工智能领域的创新浪潮,推出了三款全新的Gemini1.5系列实验性模型。这次更新不仅带来了性能的显著提升,还为用户提供了更多样化的选择。
2025-01-07 11:17:20 219人关注
iPhone 16内存限制AI潜力?iPhone 17或成最优解
最新消息显示,苹果公司的下一代旗舰手机——iPhone17系列,有望搭载12GB RAM,这一配置将为部署更大规模的端侧AI大模型提供充足的空间。
iPhone 16内存限制 iPhone 16 AI功能 iPhone 17优化方案 苹果AI手机发展 苹果内存与AI性能
2025-01-06 08:17:41 62人关注
Gemini1.5闪电升级:AI响应速度飙升50%,用户体验大幅提升
Gemini最近推出的更新为其1.5闪存模型带来了显著的性能提升,使响应速度提高了50%。这一改进在网络和移动平台上都清晰可见,尤其让Pro计划用户感受到了明显的速度提升。值得注意的是,这项优化惠及所有用户层级,包括使用该模型的三层用户,堪称一次重大升级。
2024-12-30 00:24:31 73人关注
联发科天玑9400芯片发布:搭载APU890 集成天玑AI智能体化引擎
联发科今天正式推出其新一代旗舰芯片天玑9400,这是安卓阵营首款采用3nm工艺的旗舰芯片,由台积电第二代3nm制程技术打造。