- 上云资讯 -
阿里云云原生
阿里云开发者
腾讯云开发者
火山引擎开发者社区
魔搭ModelScope社区
微软科技
Azure云科技
Zilliz
OpenAI
Anthropic
Gemini
LangChain
Hugging Face
Mistral
2025-05-16 10:15:33 85人关注
DeepSeek 开源周首日:发布大模型加速利器FlashMLA 解码性能飙升至3000GB/s
DeepSeek 开源周首日正式开源其最新技术成果FlashMLA,这是一款专为英伟达Hopper架构GPU打造的高效多层注意力(Multi-Layer Attention)解码内核。该技术特别针对变长序列场景进行优化,可显著提升大模型推理性能。
2025-02-16 16:36:46 168人关注
百度宣布文心大模型 4.5 系列即将上线,6月30日全面开源!
近日,百度在其官方渠道上宣布了令人瞩目的消息:文心大模型4.5系列将于未来几个月陆续推出,并定于6月30日正式开源。作为百度在人工智能领域的重要布局,文心大模型的不断升级和开源,意味着更多用户将能够体验到前沿的 AI 技术。
2025-01-12 06:40:37 151人关注
书生·浦语2.5开源超轻量1.8B、高性能20B多种参数版本
上海人工智能实验室在2024年7月4日的WAIC科学前沿主论坛上推出了书生·浦语系列模型的新版本InternLM2.5。这个版本在复杂场景下的推理能力得到了全面增强,支持1M超长上下文,并能自主进行互联网搜索及整合上百个网页的信息。