LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-05-15 10:38:26 95人关注

月之暗面联手UCLA推新模型Mixture-of-Expert,提升语言模型训练效率

在人工智能领域,训练大型语言模型(LLMs)已成为推动技术进步的重要方向。然而,随着模型规模和数据集的不断扩大,传统的优化方法 —— 特别是 AdamW—— 逐渐显露出其局限性。研究人员面临着计算成本高、训练不稳定等一系列挑战,包括梯度消失或爆炸、参数矩阵更新不一致及分布式环境下的资源需求高等问题。因此,迫切需要更高效、更稳定的优化技术来应对这些复杂性。

月球背面 UCLA研究 月球暗面探索 月球混合物专家 月球暗面科学发现

2025-04-20 12:31:43 64人关注

月之暗面解密o1:Long-CoT是关键,模型思考需要"放长线"

月之暗面研究员Flood Sung近日发表万字长文,首次详细披露了k1.5模型的研发思路,并就OpenAI o1模型带来的技术启示进行深度反思。

月球背面解密 长密钥技术 月球暗面探索 太空加密技术 月球科学解密

2025-02-24 16:18:21 222人关注

月之暗面推出新优化器Muon,计算效率大幅提升

近日,人工智能领域再度掀起波澜,月之暗面(Moonshot)宣布开源新版优化器 Muon,成功将计算效率提升至传统 AdamW 的两倍。这个新优化器的推出恰逢 DeepSeek 即将连续开源多个代码库,引发了业内的高度关注和讨论。

月球背面 暗面优化 μ子优化器 效率提升 暗面探测器优化

2025-01-28 13:32:21 193人关注

月之暗面发布新一代SOTA模型 k1.5:多模态推理能力再升级

月之暗面公司隆重推出其全新的 SOTA(state-of-the-art)模型 ——k1.5多模态思考模型,标志着在多模态推理和通用推理领域的重大突破。该模型不仅具备出色的多模态处理能力,还展示了卓越的通用推理能力,能够有效应对各类复杂任务。

月球背面 SOTA模型 K15模型 多模态推理 太空探索AI模型

2025-01-16 21:24:44 480人关注

AI大模型集体翻车!9.11和9.9哪个大?月之暗面回应大模型称9.11大于9.9

最近,一道简单的小学数学题却让不少AI大模型"翻了车",12个国内外知名的AI大模型中,8个模型在回答"9.11和9.9哪个大"这个问题时都答错了。

AI大模型失败案例 月球背面AI响应问题 AI模型局限性分析 AI技术挑战 AI在极端环境应用

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10