- 上云资讯 -
2025-06-07 18:13:41 29人关注
DeepSeek开源周第五天:6.6TiB/s炸场!3FS重新定义AI存储基建
中国AI领军企业DeepSeek在开源周收官之际投下技术"核弹",正式发布专为现代算力场景设计的高性能并行文件系统3FS(Fire-Flyer File System)及配套数据处理框架Smallpond。这套组合拳直击AI训练与推理的数据处理痛点,以6.6TiB/s的集群吞吐量创下行业新纪录,标志着分布式存储技术迈入新纪元。
2025-05-22 14:18:20 25人关注
DeepSeek开源周第二日:首个面向MoE模型的开源EP通信库
Deepseek 公布了开源周第二天的产品,首个面向MoE模型的开源EP通信库,支持实现了混合专家模型训练推理的全栈优化。
2025-05-16 10:15:33 27人关注
DeepSeek 开源周首日:发布大模型加速利器FlashMLA 解码性能飙升至3000GB/s
DeepSeek 开源周首日正式开源其最新技术成果FlashMLA,这是一款专为英伟达Hopper架构GPU打造的高效多层注意力(Multi-Layer Attention)解码内核。该技术特别针对变长序列场景进行优化,可显著提升大模型推理性能。
2025-03-03 10:29:21 69人关注
DeepSeek开源周第六天:极致推理优化系统,提高GPU计算效率
在人工智能(AI)技术快速发展的今天,DeepSeek 团队推出了其全新的 DeepSeek-V3/R1推理系统。这一系统旨在通过更高的吞吐量和更低的延迟,推动 AGI(通用人工智能)的高效发展。为了实现这一目标,DeepSeek 采用了跨节点专家并行(Expert Parallelism,EP)技术,显著提高了 GPU 的计算效率,并在降低延迟的同时,扩展了批处理规模。