- 上云资讯 -
2025-06-07 18:13:41 133人关注
DeepSeek开源周第五天:6.6TiB/s炸场!3FS重新定义AI存储基建
中国AI领军企业DeepSeek在开源周收官之际投下技术"核弹",正式发布专为现代算力场景设计的高性能并行文件系统3FS(Fire-Flyer File System)及配套数据处理框架Smallpond。这套组合拳直击AI训练与推理的数据处理痛点,以6.6TiB/s的集群吞吐量创下行业新纪录,标志着分布式存储技术迈入新纪元。
2025-05-22 14:18:20 66人关注
DeepSeek开源周第二日:首个面向MoE模型的开源EP通信库
Deepseek 公布了开源周第二天的产品,首个面向MoE模型的开源EP通信库,支持实现了混合专家模型训练推理的全栈优化。
2025-05-16 10:15:33 84人关注
DeepSeek 开源周首日:发布大模型加速利器FlashMLA 解码性能飙升至3000GB/s
DeepSeek 开源周首日正式开源其最新技术成果FlashMLA,这是一款专为英伟达Hopper架构GPU打造的高效多层注意力(Multi-Layer Attention)解码内核。该技术特别针对变长序列场景进行优化,可显著提升大模型推理性能。
2025-05-12 14:35:19 59人关注
超给力!DeepSeek 宣布下周开源五个项目
近日,DeepSeek 在其官网 X 账号上发布了重磅消息,宣布将在接下来的一个星期内陆续开源五个代码库。该公司表示,当前已经完成的在线服务模块经过严格的测试和部署,已具备投入生产环境的条件。
DeepSeek开源项目 DeepSeek开源技术 DeepSeek开源计划 DeepSeek开源新闻 DeepSeek开源动态
2025-05-12 10:24:26 60人关注
Deepseek宣布将连续五天发布5个开源项目 推动社区创新
北京时间,2025年2月21日,专注于探索通用人工智能(AGI)的 DeepSeek AI 团队在社交媒体上发布了一则振奋人心的消息,正式拉开了他们参与 #OpenSourceWeek 活动的序幕。这家小型但充满雄心的技术团队宣布,从下周开始,他们将开源5个代码仓库,以完全透明的方式与全球开发者社区分享他们的研究进展。
2025-03-03 10:29:21 148人关注
DeepSeek开源周第六天:极致推理优化系统,提高GPU计算效率
在人工智能(AI)技术快速发展的今天,DeepSeek 团队推出了其全新的 DeepSeek-V3/R1推理系统。这一系统旨在通过更高的吞吐量和更低的延迟,推动 AGI(通用人工智能)的高效发展。为了实现这一目标,DeepSeek 采用了跨节点专家并行(Expert Parallelism,EP)技术,显著提高了 GPU 的计算效率,并在降低延迟的同时,扩展了批处理规模。
2025-01-16 09:16:37 100人关注
DeepSeek开源DeepSeek-V2-Chat-0628模型 代码、数学推理能力提升
近日,LMSYS组织的大模型竞技场(Chatbot Arena)发布了最新的榜单更新,LMSYS Chatbot Arena 排行榜上总排名11超过了所有开源模型,包括Llama3-70B、Qwen2-72B、Nemotron-4-340B、Gemma2-27B等,荣获全球开源模型榜首的荣誉。