上云资讯 - 来上云吧，企业上云一站式服务

AI对话上云服务上云资讯解决方案关于我们

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-05-15 10:38:26 254人关注

月之暗面联手UCLA推新模型Mixture-of-Expert，提升语言模型训练效率

在人工智能领域，训练大型语言模型（LLMs）已成为推动技术进步的重要方向。然而，随着模型规模和数据集的不断扩大，传统的优化方法 —— 特别是 AdamW—— 逐渐显露出其局限性。研究人员面临着计算成本高、训练不稳定等一系列挑战，包括梯度消失或爆炸、参数矩阵更新不一致及分布式环境下的资源需求高等问题。因此，迫切需要更高效、更稳定的优化技术来应对这些复杂性。

月球背面 UCLA研究月球暗面探索月球混合物专家月球暗面科学发现

2025-04-20 12:31:43 225人关注

月之暗面解密o1:Long-CoT是关键，模型思考需要"放长线"

月之暗面研究员Flood Sung近日发表万字长文，首次详细披露了k1.5模型的研发思路，并就OpenAI o1模型带来的技术启示进行深度反思。

月球背面解密长密钥技术月球暗面探索太空加密技术月球科学解密

2025-02-24 16:18:21 622人关注

月之暗面推出新优化器Muon，计算效率大幅提升

近日，人工智能领域再度掀起波澜，月之暗面（Moonshot）宣布开源新版优化器 Muon，成功将计算效率提升至传统 AdamW 的两倍。这个新优化器的推出恰逢 DeepSeek 即将连续开源多个代码库，引发了业内的高度关注和讨论。

月球背面暗面优化 μ子优化器效率提升暗面探测器优化

2025-01-28 13:32:21 461人关注

月之暗面发布新一代SOTA模型 k1.5：多模态推理能力再升级

月之暗面公司隆重推出其全新的 SOTA（state-of-the-art）模型 ——k1.5多模态思考模型，标志着在多模态推理和通用推理领域的重大突破。该模型不仅具备出色的多模态处理能力，还展示了卓越的通用推理能力，能够有效应对各类复杂任务。

月球背面 SOTA模型 K15模型多模态推理太空探索AI模型

2025-01-16 21:24:44 733人关注

AI大模型集体翻车！9.11和9.9哪个大？月之暗面回应大模型称9.11大于9.9

最近，一道简单的小学数学题却让不少AI大模型"翻了车"，12个国内外知名的AI大模型中，8个模型在回答"9.11和9.9哪个大"这个问题时都答错了。

AI大模型失败案例月球背面AI响应问题 AI模型局限性分析 AI技术挑战 AI在极端环境应用