LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-06-02 10:22:34 784人关注

DeepSeek开源第四天发布并行策略升级:DualPipe与EPLB技术推动大模型训练革命

今日,国内人工智能领军企业DeepSeek正式公开其开源计划的第四日成果——Optimized Parallelism Strategies(优化并行策略),重点推出双向管道并行算法DualPipe、专家并行负载均衡器EPLB,以及对计算-通信重叠机制的深度优化。此次技术升级直击大规模语言模型训练的核心痛点,为超万卡级集群的高效运行提供了全新解决方案。

DeepSeek开源 并行策略 DualPipe EPLB 大模型训练优化 开源模型技术

2025-01-15 06:44:26 101人关注

​英伟达推出 Minitron 小型语言模型:训练速度提高 40 倍

最近,英伟达(NVIDIA)在人工智能领域又有了新动作,他们推出了 Minitron 系列的小型语言模型,包含4B 和8B 两个版本。这些模型不仅让训练速度提高了整整40倍,还能让开发者更轻松地使用它们进行各种应用,比如翻译、情感分析和对话 AI 等。

NVIDIA Minitron 语言模型训练加速 40倍训练速度提升 大模型训练优化 GPU加速训练技术

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10