LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-05-27 08:24:17 90人关注

DeepSeek开源周第3天:发布DeepGEMM,FP8 GEMM库助力AI训练与推理

中国人工智能公司DeepSeek在其“开源周”第3天宣布推出DeepGEMM——一款支持FP8通用矩阵乘法(GEMM)的开源库。这一工具专为密集型和混合专家(MoE)矩阵运算设计,为DeepSeek V3和R1模型的训练与推理提供强大支持。官方消息通过X平台发布,迅速引发技术社区的热烈反响。

DeepSeek开源周 DeepGemm FP8训练 AI推理优化 AI训练加速 开源AI模型

2025-02-15 08:18:30 90人关注

谷歌利用小模型加速 AI 训练大模型,提升 28% 效率

近年来,训练大型语言模型(LLM)变得越来越昂贵且复杂,只有少数大型科技公司具备相应的计算资源。不过,谷歌最近推出了一种名为 SALT(小模型辅助大模型训练)的新方法,这一创新可能会彻底改变 AI 训练的格局。

谷歌小模型 AI训练加速 小模型优化 AI训练效率提升 谷歌AI技术进展

2025-01-20 09:35:42 1036人关注

Meta AI 推出革命性数据加载工具 SPDL:让 AI 训练提速三倍!

在当今的人工智能领域,训练模型不仅仅是设计更好的架构,还需要高管理数据。现代 AI 模型需要大量数据,并且这些数据必须快速送达 GPU 和其他加速器。

Meta AI SPDL AI训练速度提升 AI训练加速技术 Meta AI技术突破

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10