- 上云资讯 -
2025-09-02 08:16:39 183人关注
美团发布 LongCat-Flash-Chat:560B 参数模型再创新高,智能体表现惊艳!
近日,美团正式发布并开源了其最新的 AI 大模型 ——LongCat-Flash-Chat。这款模型以560B 的总参数量和18.6B 到31.3B 的激活参数范围,展现了其在计算效率与性能之间的优越平衡。LongCat-Flash 采用了创新的混合专家模型(MoE)架构,利用 “零计算专家” 机制,使得每个 token 在处理时仅激活必要的参数,确保算力高效利用。
2025-08-05 15:10:19 161人关注
OpenAI重磅开源!GPT-OSS模型泄露,116亿参数MoE架构震撼曝光,AI新纪元来袭?
近日,网络上流传出OpenAI即将推出开源模型系列“GPT-OSS”(GPT Open Source Software)的重大信息泄露,引发业界广泛关注。据泄露的配置文件,这一操作系统系列模型参数规模从20亿到120亿不等,采用先进的MoE(Mixture of Experts)架构,结合长上下文扩展和高效注意力机制,展现出强大的性能潜力。AIbase编辑团队综合最新信息,为您深度解析GPT-OSS的技术亮点及其对AI行业的潜在影响。
2025-01-03 21:13:40 161人关注
元象发布MoE开源大模型XVERSE-MoE-A36B 激活参数达36B
深圳元象信息科技有限公司近日宣布,公司已成功发布中国最大的Mixture of Experts(MoE)开源大模型——XVERSE-MoE-A36B。这款模型的发布标志着中国在AI领域的一大进步,将国产开源技术提升至国际领先水平。