上云资讯 - 来上云吧，企业上云一站式服务

2025-10-29 09:25:38 48人关注

蚂蚁百灵大模型团队开源Ring-flash-linear-2.0-128K，混合注意力+MoE架构重塑长文本编程效率

在AI大模型竞争白热化的当下，高效推理与长上下文处理已成为开发者痛点。近日，蚂蚁集团旗下百灵大模型团队正式开源Ring-flash-linear-2.0-128K，一款专为超长文本编程设计的创新模型。该模型以混合线性注意力机制和稀疏MoE架构为核心，激活仅6.1B参数即媲美40B密集模型，在代码生成、智能代理等领域实现SOTA（最优）表现。AIbase基于Hugging Face官方发布与技术报告独家解析其突破性亮点，助力开发者拥抱“高效AI编程”新时代。

AI

2025-10-18 16:11:37 60人关注

巨人网络联手清华大学首创DiaMoE-TTS，开源多方言语音合成大模型框架

巨人网络AI Lab与清华大学电子工程系SATLab研究团队近日联合发布一项重大突破:首创多方言语音合成大模型框架DiaMoE-TTS，并宣布将数据、代码、方法全方位开源，旨在推动方言语音合成的公平与普惠。

AI

2025-09-12 17:18:45 117人关注

挑战主流认知！蚂蚁、人大在2025外滩大会发布行业首个原生MoE扩散语言模型

蚂蚁集团和人民大学联合研发原生MoE架构扩散语言模型（dLLM） LLaDA-MoE，在约20T数据上完成了从零训练MoE架构的扩散语言模型，验证了工业级大规模训练的扩展性和稳定性;效果超过此前发布稠密扩散语言模型LLaDA1.0/1.5和Dream-7B，比肩等效自回归模型，并保有数倍的推理速度优势。模型将在近期完全开源，以推动全球AI社区在dLLM上的技术发展。

MoE架构扩散语言模型 LLaDA-MoE模型开源 dLLM技术发展工业级大规模训练扩散语言模型推理速度优势 AI社区技术推动

2025-09-02 08:16:39 276人关注

美团发布 LongCat-Flash-Chat：560B 参数模型再创新高，智能体表现惊艳！

近日，美团正式发布并开源了其最新的 AI 大模型 ——LongCat-Flash-Chat。这款模型以560B 的总参数量和18.6B 到31.3B 的激活参数范围，展现了其在计算效率与性能之间的优越平衡。LongCat-Flash 采用了创新的混合专家模型（MoE）架构，利用 “零计算专家” 机制，使得每个 token 在处理时仅激活必要的参数，确保算力高效利用。

美团AI大模型 LongCat-Flash-Chat 混合专家模型架构 MoE架构优势零计算专家机制大模型参数优化

2025-08-13 14:37:44 142人关注

腾讯混元发布52B参数多模态理解模型Large-Vision，支持任意分辨率全场景输入

腾讯混元团队近日发布了全新的多模态理解模型——混元Large-Vision，该模型采用腾讯混元擅长的MoE（专家混合）架构，激活参数达到52B规模，在性能与效率之间实现了良好平衡。

腾讯混元Large-Vision 多模态理解模型 MoE架构混元大模型 52B参数模型腾讯混元团队

2025-08-05 15:10:19 226人关注

OpenAI重磅开源！GPT-OSS模型泄露，116亿参数MoE架构震撼曝光，AI新纪元来袭？

近日，网络上流传出OpenAI即将推出开源模型系列“GPT-OSS”（GPT Open Source Software）的重大信息泄露，引发业界广泛关注。据泄露的配置文件，这一操作系统系列模型参数规模从20亿到120亿不等，采用先进的MoE(Mixture of Experts)架构，结合长上下文扩展和高效注意力机制，展现出强大的性能潜力。AIbase编辑团队综合最新信息，为您深度解析GPT-OSS的技术亮点及其对AI行业的潜在影响。

OpenAI开源模型 GPT-OSS技术解析 MoE架构优势长上下文扩展技术高效注意力机制 AI行业影响

2025-08-02 17:13:19 170人关注

阿里开源通义万相Wan2.2:全球首个MoE架构视频生成模型震撼发布

阿里巴巴今晚正式开源视频生成模型"通义万相Wan2.2"，此次发布包含三款核心模型:文生视频（Wan2.2-T2V-A14B）、图生视频(Wan2.2-I2V-A14B)和统一视频生成(Wan2.2-IT2V-5B)模型，标志着视频生成技术迎来重大突破。

通义万相Wan2.2 视频生成模型文生视频模型图生视频模型统一视频生成模型阿里巴巴开源AI

2025-07-15 14:42:22 734人关注

硅基流动上线强大编码模型 Kimi K2，助力智能应用发展

近日，硅基流动（SiliconCloud）平台正式上线了月之暗面开源的 MoE 模型 Kimi K2。这款模型总参数达到1T，激活参数为32B，在各项基准性能测试中表现不俗，能够与顶尖的商业模型相媲美。Kimi K2特别擅长编码和通用智能体(Agent)任务，为开发者提供了一个强有力的工具。

硅基流动平台 Kimi K2模型 MoE模型 1T参数大模型通用智能体任务编码能力优化

2025-07-12 16:12:20 788人关注

月之暗面Kimi K2 模型发布并开源擅长代码与 Agentic 任务

月之暗面公司正式发布了其最新力作——Kimi K2模型，并同步宣布开源。这款基于MoE架构的基础模型，凭借其强大的代码能力、卓越的通用Agent任务处理能力，一经发布便在AI领域引起了广泛关注。

Kimi K2模型 MoE架构基础模型开源AI模型代码能力AI模型通用Agent任务处理月之暗面公司AI技术

2025-06-30 16:29:19 117人关注

百度重磅开源文心大模型 4.5 系列，国内大模型市场再掀波澜！

近日，百度正式宣布开源其文心大模型4.5系列，共推出了十款模型，包括47B、3B 激活参数的混合专家（MoE）模型，以及0.3B 参数的稠密型模型。此次开源不仅实现了预训练权重的完整公开，还提供了推理代码，标志着百度在大模型领域的重大进展。

百度文心大模型4.5 文心大模型开源 MoE模型大模型预训练权重大模型推理代码百度大模型进展

2025-06-30 11:22:37 107人关注

华为开源盘古7B稠密和72B混合专家模型

6月30日，华为于正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE720亿参数的混合专家模型，以及基于升腾的模型推理技术。

华为盘古模型开源盘古70亿参数稠密模型盘古Pro MoE720亿参数模型升腾模型推理技术华为大模型开源

2025-06-28 08:22:28 228人关注

腾讯开源轻量级混元-A13B模型 1张中低端GPU卡即可部署

腾讯正式发布并开源混元大模型家族的新成员——混元-A13B模型。该模型采用基于专家混合（MoE）架构，总参数规模达800亿，激活参数为130亿，在保持顶尖开源模型效果的同时，大幅降低了推理延迟与计算开销，为个人开发者和中小企业提供了更具性价比的AI解决方案。

腾讯混元大模型混元-A13B模型 MoE架构开源AI模型 AI推理优化中小企业AI解决方案

2025-06-22 08:31:17 217人关注

蚂蚁开源轻量级MoE推理模型Ring-lite

近日，蚂蚁技术团队宣布正式开源其轻量级推理模型Ring-lite。该模型在多项推理榜单上取得了显著成绩，实现了轻量级推理模型的SOTA效果，再次验证了MoE架构的推理潜力。

蚂蚁技术团队开源 Ring-lite推理模型轻量级推理模型SOTA MoE架构推理潜力推理模型榜单成绩

2025-05-22 14:18:20 144人关注

DeepSeek开源周第二日：首个面向MoE模型的开源EP通信库

Deepseek 公布了开源周第二天的产品，首个面向MoE模型的开源EP通信库，支持实现了混合专家模型训练推理的全栈优化。

DeepSeek开源周 MoE模型 EP通信库开源通信库 MoE模型通信优化

2025-03-27 16:27:43 256人关注

腾讯发布Hunyuan-TurboS：首款超大型混合Transformer-Mamba MoE模型震撼登场

今日，腾讯在X平台上正式宣布推出其最新AI模型Hunyuan-TurboS，这款被誉为“首款超大型Hybrid-Transformer-Mamba MoE模型”的产品迅速引发全球科技圈的热议。根据X用户披露的信息，Hunyuan-TurboS通过融合Mamba的高效长序列处理能力和Transformer的强大上下文理解能力，成功克服了传统纯Transformer模型在长文本训练和推理上的瓶颈，展现出令人瞩目的性能突破。

腾讯混元 TurboS Transformer Mamba MoE 大模型技术 AI模型架构 Transformer优化

2025-01-18 02:28:26 130人关注

谷歌提出百万专家Mixture 释放进一步扩展 Transformer 的潜力

Google DeepMind提出的百万专家Mixture模型，一个在Transformer架构上迈出了革命性步伐的研究。

Google Mixture Experts Transformer 模型 MoE 技术大模型架构 AI 模型优化 Google AI 技术突破

2025-01-04 18:42:31 159人关注

AI2 推出全新开源模型 OLMoE：高效、强大且不再昂贵！

最近，艾伦人工智能研究所（AI2）发布了一款全新的开源模型 OLMoE，旨在满足对大型语言模型(LLM)的需求。这个模型不仅性能优异，而且成本相对低廉。

AI大模型 OLMoE模型高效AI模型强大AI模型经济实惠AI解决方案 AI模型性能优化

2025-01-03 21:13:40 185人关注

元象发布MoE开源大模型XVERSE-MoE-A36B 激活参数达36B

深圳元象信息科技有限公司近日宣布，公司已成功发布中国最大的Mixture of Experts（MoE）开源大模型——XVERSE-MoE-A36B。这款模型的发布标志着中国在AI领域的一大进步，将国产开源技术提升至国际领先水平。

Xverse-MoE 36B参数大模型 MoE架构优势大模型技术原理大模型应用场景

2024-12-25 13:19:16 133人关注

OPPO率先实现终端MoE落地 AI处理效率提升40%

OPPO今日宣布在全球首次成功将专家混合模型（MoE）架构应用于移动设备。这一突破性进展显著提升了AI处理效率，为终端AI技术的进一步发展开辟了新途径，同时也为AI与移动硬件的深度融合奠定了基础。

OPPO MoE AI效率提升大模型技术 MoE架构优化 AI性能优化 OPPO AI创新

- 上云资讯 -

蚂蚁百灵大模型团队开源Ring-flash-linear-2.0-128K，混合注意力+MoE架构重塑长文本编程效率

巨人网络联手清华大学首创DiaMoE-TTS，开源多方言语音合成大模型框架

挑战主流认知！蚂蚁、人大在2025外滩大会发布行业首个原生MoE扩散语言模型

美团发布 LongCat-Flash-Chat：560B 参数模型再创新高，智能体表现惊艳！

腾讯混元发布52B参数多模态理解模型Large-Vision，支持任意分辨率全场景输入

OpenAI重磅开源！GPT-OSS模型泄露，116亿参数MoE架构震撼曝光，AI新纪元来袭？

阿里开源通义万相Wan2.2:全球首个MoE架构视频生成模型震撼发布

硅基流动上线强大编码模型 Kimi K2，助力智能应用发展

月之暗面Kimi K2 模型发布并开源擅长代码与 Agentic 任务

百度重磅开源文心大模型 4.5 系列，国内大模型市场再掀波澜！

华为开源盘古7B稠密和72B混合专家模型

腾讯开源轻量级混元-A13B模型 1张中低端GPU卡即可部署

蚂蚁开源轻量级MoE推理模型Ring-lite

DeepSeek开源周第二日：首个面向MoE模型的开源EP通信库

腾讯发布Hunyuan-TurboS：首款超大型混合Transformer-Mamba MoE模型震撼登场

谷歌提出百万专家Mixture 释放进一步扩展 Transformer 的潜力

AI2 推出全新开源模型 OLMoE：高效、强大且不再昂贵！

元象发布MoE开源大模型XVERSE-MoE-A36B 激活参数达36B

OPPO率先实现终端MoE落地 AI处理效率提升40%

推荐阅读

上云服务

- 上云资讯 -

蚂蚁百灵大模型团队开源Ring-flash-linear-2.0-128K，混合注意力+MoE架构重塑长文本编程效率

巨人网络联手清华大学首创DiaMoE-TTS，开源多方言语音合成大模型框架

挑战主流认知！蚂蚁、人大在2025外滩大会发布行业首个原生MoE扩散语言模型

美团发布 LongCat-Flash-Chat：560B 参数模型再创新高，智能体表现惊艳！

腾讯混元发布52B参数多模态理解模型Large-Vision，支持任意分辨率全场景输入

OpenAI重磅开源！GPT-OSS模型泄露，116亿参数MoE架构震撼曝光，AI新纪元来袭？

阿里开源通义万相Wan2.2:全球首个MoE架构视频生成模型震撼发布

硅基流动上线强大编码模型 Kimi K2，助力智能应用发展

月之暗面Kimi K2 模型发布并开源 擅长代码与 Agentic 任务

百度重磅开源文心大模型 4.5 系列，国内大模型市场再掀波澜！

华为开源盘古7B稠密和72B混合专家模型

腾讯开源轻量级混元-A13B模型 1张中低端GPU卡即可部署

蚂蚁开源轻量级MoE推理模型Ring-lite

DeepSeek开源周第二日：首个面向MoE模型的开源EP通信库

腾讯发布Hunyuan-TurboS：首款超大型混合Transformer-Mamba MoE模型震撼登场

谷歌提出百万专家Mixture 释放进一步扩展 Transformer 的潜力

​AI2 推出全新开源模型 OLMoE：高效、强大且不再昂贵！

元象发布MoE开源大模型XVERSE-MoE-A36B 激活参数达36B

OPPO率先实现终端MoE落地 AI处理效率提升40%

推荐阅读

上云服务

月之暗面Kimi K2 模型发布并开源擅长代码与 Agentic 任务

AI2 推出全新开源模型 OLMoE：高效、强大且不再昂贵！