- 上云资讯 -
阿里云云原生
阿里云开发者
腾讯云开发者
火山引擎开发者社区
魔搭ModelScope社区
微软科技
Azure云科技
Zilliz
OpenAI
Anthropic
Gemini
LangChain
Hugging Face
Mistral
2025-01-17 18:41:40 129人关注
新的Transformer加速技术FlashAttention-3发布 成本直线下降
全新的Transformer加速技术FlashAttention-3震撼发布啦!这可不仅仅是个升级,它预示着咱们的大型语言模型(LLMs)的推理速度直线上升和成本的直线下降!
2025-01-01 11:30:15 130人关注
百度百舸4.0升级:秒级部署、95%训练效能、99.5%有效训练时长
百度集团执行副总裁沈抖在今日举行的2024百度云智大会上宣布了百度百舸计算平台4.0的升级。这一新版本支持多芯混合训练与多芯适配,并在万卡集群上实现了超过99.5%的有效训练时长,显著提升了算力使用效率。