LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-06-07 18:13:41 133人关注

DeepSeek开源周第五天:6.6TiB/s炸场!3FS重新定义AI存储基建

中国AI领军企业DeepSeek在开源周收官之际投下技术"核弹",正式发布专为现代算力场景设计的高性能并行文件系统3FS(Fire-Flyer File System)及配套数据处理框架Smallpond。这套组合拳直击AI训练与推理的数据处理痛点,以6.6TiB/s的集群吞吐量创下行业新纪录,标志着分布式存储技术迈入新纪元。

DeepSeek开源 6.6TiB/s存储 3FS AI存储 AI存储技术 高性能存储解决方案

2025-06-02 10:22:34 784人关注

DeepSeek开源第四天发布并行策略升级:DualPipe与EPLB技术推动大模型训练革命

今日,国内人工智能领军企业DeepSeek正式公开其开源计划的第四日成果——Optimized Parallelism Strategies(优化并行策略),重点推出双向管道并行算法DualPipe、专家并行负载均衡器EPLB,以及对计算-通信重叠机制的深度优化。此次技术升级直击大规模语言模型训练的核心痛点,为超万卡级集群的高效运行提供了全新解决方案。

DeepSeek开源 并行策略 DualPipe EPLB 大模型训练优化 开源模型技术

2025-06-02 10:21:36 563人关注

AI日报:DeepSeek开源新版R1-0528;字节发布图像Agent小云雀AI;可灵2.1重磅上线

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

字节跳动 DeepSeek R1 小云AI Agent框架 大模型技术 AI技术发展

2025-05-27 08:24:17 90人关注

DeepSeek开源周第3天:发布DeepGEMM,FP8 GEMM库助力AI训练与推理

中国人工智能公司DeepSeek在其“开源周”第3天宣布推出DeepGEMM——一款支持FP8通用矩阵乘法(GEMM)的开源库。这一工具专为密集型和混合专家(MoE)矩阵运算设计,为DeepSeek V3和R1模型的训练与推理提供强大支持。官方消息通过X平台发布,迅速引发技术社区的热烈反响。

DeepSeek开源周 DeepGemm FP8训练 AI推理优化 AI训练加速 开源AI模型

2025-05-22 14:18:20 66人关注

DeepSeek开源周第二日:首个面向MoE模型的开源EP通信库

Deepseek 公布了开源周第二天的产品,首个面向MoE模型的开源EP通信库,支持实现了混合专家模型训练推理的全栈优化。

DeepSeek开源周 MoE模型 EP通信库 开源通信库 MoE模型通信优化

2025-05-16 10:15:33 84人关注

DeepSeek 开源周首日:发布大模型加速利器FlashMLA 解码性能飙升至3000GB/s

DeepSeek 开源周首日正式开源其最新技术成果FlashMLA,这是一款专为英伟达Hopper架构GPU打造的高效多层注意力(Multi-Layer Attention)解码内核。该技术特别针对变长序列场景进行优化,可显著提升大模型推理性能。

DeepSeek开源周 FlashMLA 3000GBs 大模型开源技术 DeepSeek开源模型 高性能AI模型

2025-05-12 14:35:19 59人关注

超给力!DeepSeek 宣布下周开源五个项目

近日,DeepSeek 在其官网 X 账号上发布了重磅消息,宣布将在接下来的一个星期内陆续开源五个代码库。该公司表示,当前已经完成的在线服务模块经过严格的测试和部署,已具备投入生产环境的条件。

DeepSeek开源项目 DeepSeek开源技术 DeepSeek开源计划 DeepSeek开源新闻 DeepSeek开源动态

2025-05-12 10:24:26 60人关注

Deepseek宣布将连续五天发布5个开源项目 推动社区创新

北京时间,2025年2月21日,专注于探索通用人工智能(AGI)的 DeepSeek AI 团队在社交媒体上发布了一则振奋人心的消息,正式拉开了他们参与 #OpenSourceWeek 活动的序幕。这家小型但充满雄心的技术团队宣布,从下周开始,他们将开源5个代码仓库,以完全透明的方式与全球开发者社区分享他们的研究进展。

DeepSeek 开源项目 5天5开源 DeepSeek开源项目 开源项目进展

2025-03-03 10:29:21 148人关注

DeepSeek开源周第六天:极致推理优化系统,提高GPU计算效率

在人工智能(AI)技术快速发展的今天,DeepSeek 团队推出了其全新的 DeepSeek-V3/R1推理系统。这一系统旨在通过更高的吞吐量和更低的延迟,推动 AGI(通用人工智能)的高效发展。为了实现这一目标,DeepSeek 采用了跨节点专家并行(Expert Parallelism,EP)技术,显著提高了 GPU 的计算效率,并在降低延迟的同时,扩展了批处理规模。

DeepSeek开源周报 GPU计算优化 DeepSeek技术更新 开源AI模型优化 高性能计算优化

2025-01-23 19:21:12 247人关注

DeepSeek开源大模型开发者之一罗福莉将加盟小米

据第一财经报道,DeepSeek 开源大模型 DeepSeek-V2的关键开发者罗福莉将加入小米,担任小米 AI 实验室的领导,并负责大模型团队的建设。这一消息引起了广泛关注,尤其是在小米计划加强其在大模型领域的布局之际。

罗永浩加入小米 罗永浩小米合作 罗永浩新动向 小米高管变动 罗永浩加盟小米

2025-01-16 09:16:37 100人关注

DeepSeek开源DeepSeek-V2-Chat-0628模型 代码、数学推理能力提升

近日,LMSYS组织的大模型竞技场(Chatbot Arena)发布了最新的榜单更新,LMSYS Chatbot Arena 排行榜上总排名11超过了所有开源模型,包括Llama3-70B、Qwen2-72B、Nemotron-4-340B、Gemma2-27B等,荣获全球开源模型榜首的荣誉。

DeepSeek V2 Chat模型 代码能力 数学推理 大模型技术 DeepSeek模型更新

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10