- 上云资讯 -
2025-12-13 09:18:29 15人关注
蚂蚁开源 LLaDA2.0,业内首个100B 参数规模的扩散语言模型
在大语言模型技术发展的新潮流中,蚂蚁技术研究院于近日正式发布了 LLaDA2.0系列,这是业内首个参数规模达到100B 的离散扩散大语言模型(dLLM)。这一创新的模型不仅打破了扩散模型难以规模化的固有印象,还在生成质量和推理速度上实现了显著的提升,为大语言模型领域开辟了新的发展方向。
2025-11-16 14:35:36 46人关注
Inception重启!获5000万美元融资推出新一代扩散语言模型Mercury
人工智能初创公司 Inception 宣布重获新生,并完成 5000万美元新融资,由 Menlo Ventures 领投,微软旗下 M12基金、英伟达、Databricks 和 Snowflake 等共同参投。值得注意的是,该公司创始人、DeepMind 联合创始人 Mustafa Suleyman 曾于2024年将 Inception 出售给微软,如今公司再度复活。
2025-10-19 10:26:30 175人关注
蚂蚁集团重磅推出 dInfer:让扩散语言模型的推理速度飙升 10 倍!
近日,蚂蚁集团正式开源了业内首个高性能扩散语言模型推理框架 ——dInfer。这一框架的推出,不仅意味着扩散语言模型在推理速度上取得了重大突破,也标志着这一新兴技术向实际应用迈出了重要一步。
2025-10-14 09:37:24 92人关注
首次超越自回归模型!蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer
10月13日,蚂蚁集团正式开源业界首个高性能扩散语言模型推理框架dInfer。
2025-09-12 17:18:45 168人关注
挑战主流认知!蚂蚁、人大在2025外滩大会发布行业首个原生MoE扩散语言模型
蚂蚁集团和人民大学联合研发原生MoE架构扩散语言模型(dLLM) LLaDA-MoE,在约20T数据上完成了从零训练MoE架构的扩散语言模型,验证了工业级大规模训练的扩展性和稳定性;效果超过此前发布稠密扩散语言模型LLaDA1.0/1.5和Dream-7B,比肩等效自回归模型,并保有数倍的推理速度优势。模型将在近期完全开源,以推动全球AI社区在dLLM上的技术发展。
MoE架构扩散语言模型 LLaDA-MoE模型开源 dLLM技术发展 工业级大规模训练 扩散语言模型推理速度优势 AI社区技术推动
