- 上云资讯 -
2025-05-16 10:15:33 27人关注
DeepSeek 开源周首日:发布大模型加速利器FlashMLA 解码性能飙升至3000GB/s
DeepSeek 开源周首日正式开源其最新技术成果FlashMLA,这是一款专为英伟达Hopper架构GPU打造的高效多层注意力(Multi-Layer Attention)解码内核。该技术特别针对变长序列场景进行优化,可显著提升大模型推理性能。
2025-02-16 16:36:46 103人关注
百度宣布文心大模型 4.5 系列即将上线,6月30日全面开源!
近日,百度在其官方渠道上宣布了令人瞩目的消息:文心大模型4.5系列将于未来几个月陆续推出,并定于6月30日正式开源。作为百度在人工智能领域的重要布局,文心大模型的不断升级和开源,意味着更多用户将能够体验到前沿的 AI 技术。