- 上云资讯 -
2025-03-07 10:41:29 176人关注
Light-R1-32B:低成本高性能的数学解题新星闪耀登场
2025年3月6日,一款名为 **Light-R1-32B** 的全新语言模型正式亮相。这款基于 **Qwen2.5-32B-Instruct** 模型打造的数学解题利器,经过特别训练,以其卓越的数学解题能力、低廉的训练成本以及可复现性,成为人工智能领域的一大亮点。开发团队xAI表示,Light-R1-32B不仅在性能上超越同类模型,还为学术研究和实际应用提供了极具价值的参考。
2025-03-03 10:29:21 148人关注
DeepSeek开源周第六天:极致推理优化系统,提高GPU计算效率
在人工智能(AI)技术快速发展的今天,DeepSeek 团队推出了其全新的 DeepSeek-V3/R1推理系统。这一系统旨在通过更高的吞吐量和更低的延迟,推动 AGI(通用人工智能)的高效发展。为了实现这一目标,DeepSeek 采用了跨节点专家并行(Expert Parallelism,EP)技术,显著提高了 GPU 的计算效率,并在降低延迟的同时,扩展了批处理规模。
2025-01-21 19:10:19 148人关注
AMD 发布开源平台 ROCm 6.3:提升 AI、ML 与 HPC 工作负载
随着人工智能(AI)、机器学习(ML)和高性能计算(HPC)在各行业的迅速发展,面对这些工作负载所带来的挑战,AMD 近日推出了 ROCm6.3,这是一个专为 AMD Instinct GPU 加速器设计的开源平台。该平台的推出旨在帮助开发人员应对计算资源、内存管理和优化软件方面的需求,提升工作效率。
AMD ROCm 6.3 AI 机器学习 HPC 高性能计算 AMD 计算平台 ROCm 6.3 新特性 AI 与 HPC 技术
2025-01-15 07:36:32 173人关注
云计算公司Lambda推出按需获取Nvidia H100 GPU的全新集群服务
最近,GPU 云计算公司 Lambda 宣布推出其全新的1-Click 集群服务,客户现在可以按需获取 Nvidia H100GPU 和 Quantum2InfiniBand 集群。这一创新服务使得企业能够仅在需要的时候获得计算能力,尤其适合那些不需要24小时全天候使用 GPU 的公司。
2025-01-07 08:16:30 84人关注
AWS 新推出超级计算服务,让企业用上 “云端超级电脑”
最近,亚马逊云服务(AWS)推出了一项全新的高性能计算(HPC)管理服务,旨在让企业更方便地使用超级计算机。这个新服务叫做 AWS 并行计算服务,主要是为了消除企业在使用高性能计算集群时的障碍,特别是那些对内部系统管理员要求较高的传统模式。
2024-12-25 07:34:42 67人关注
RackBank 在印多尔建设新数据中心,将容纳 6 万块 GPU!
最近,数据中心公司 RackBank 宣布了一项激动人心的计划,他们将在印度中部的印多尔市建立一个专为人工智能(AI)打造的数据中心。这个数据中心的规模相当可观,预计将能够容纳多达6万块图形处理单元(GPU),这对推动 AI 技术的发展无疑是一大助力。
2024-12-20 00:36:44 105人关注
英伟达Blackwell平台发布:AI训练性能暴增2.2倍,GPU需求大幅减少!
近日,英伟达发布了其全新的 Blackwell 平台,并在 MLPerf Training4.1基准测试中展示了初步的性能表现。根据测试结果,Blackwell 在某些方面的性能相比于前一代 Hopper 平台实现了翻倍的提升,这一成果引起了业界的广泛关注。