上云资讯 - 来上云吧，企业上云一站式服务

AI对话上云服务上云资讯解决方案关于我们

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-05-15 10:38:26 230人关注

月之暗面联手UCLA推新模型Mixture-of-Expert，提升语言模型训练效率

在人工智能领域，训练大型语言模型（LLMs）已成为推动技术进步的重要方向。然而，随着模型规模和数据集的不断扩大，传统的优化方法 —— 特别是 AdamW—— 逐渐显露出其局限性。研究人员面临着计算成本高、训练不稳定等一系列挑战，包括梯度消失或爆炸、参数矩阵更新不一致及分布式环境下的资源需求高等问题。因此，迫切需要更高效、更稳定的优化技术来应对这些复杂性。

月球背面 UCLA研究月球暗面探索月球混合物专家月球暗面科学发现

2025-04-20 12:31:43 193人关注

月之暗面解密o1:Long-CoT是关键，模型思考需要"放长线"

月之暗面研究员Flood Sung近日发表万字长文，首次详细披露了k1.5模型的研发思路，并就OpenAI o1模型带来的技术启示进行深度反思。

月球背面解密长密钥技术月球暗面探索太空加密技术月球科学解密

2025-01-12 07:23:12 360人关注

月之暗面 Kimi 开放平台：上下文缓存 Cache 存储费用降价 50%

月之暗面旗下Kimi 开放平台宣布，上下文缓存 Cache 存储费用降价50%。具体为:Cache 存储费用由10元/1M tokens/min，降低至5元/1M tokens/min。

月球暗面 Kimi缓存存储费用降低新闻动态科技资讯

2024-12-07 14:43:17 419人关注

杨植麟回应月之暗面仲裁案，首次澄清张予彤股份问题

近日，金沙江创投主管合伙人朱啸虎多次在社交平台上发文回应月之暗面仲裁案，并“炮轰”前金沙江创投主管合伙人张予彤。针对此事，月之暗面创始人兼CEO杨植麟于昨晚通过社交媒体发表声明，回应了关于他离开前公司重新创业以及张予彤在月之暗面股份的问题。

月球暗面仲裁杨志林回应国际仲裁案例月球资源争端太空法律争议