如果您需要任何上云服务
请随时联系我们:
电话:021-50583875
邮箱:service@yuncan.com
2025-05-15 10:38:26 34人关注
在人工智能领域,训练大型语言模型(LLMs)已成为推动技术进步的重要方向。然而,随着模型规模和数据集的不断扩大,传统的优化方法 —— 特别是 AdamW—— 逐渐显露出其局限性。研究人员面临着计算成本高、训练不稳定等一系列挑战,包括梯度消失或爆炸、参数矩阵更新不一致及分布式环境下的资源需求高等问题。因此,迫切需要更高效、更稳定的优化技术来应对这些复杂性。
月球背面 UCLA研究 月球暗面探索 月球混合物专家 月球暗面科学发现
2025-03-22 08:11:30 34人关注
天眼查App显示,腾讯科技(深圳)有限公司近日申请了一项名为“大语言模型的训练方法、装置、计算机设备及存储介质”的专利。这项专利的摘要揭示了该方法通过引入第一摘要文本和第二摘要文本,在大语言模型的训练过程中为模型提供更多可学习的信息。
腾讯专利 大语言模型训练 大模型训练技术 腾讯大模型专利 语言模型训练方法
2025-02-09 10:25:45 80人关注
近日,腾讯科技(深圳)有限公司在天眼查 App 上公布了一项关于大语言模型的训练方法及相关设备的专利。这项专利的名称为 “大语言模型的训练方法、装置、计算机设备及存储介质”,旨在通过创新的训练方式,提升大语言模型的学习能力和准确性。
腾讯新专利 语言模型训练 训练精度提升 大模型技术 专利技术解析 AI模型优化
2024-12-30 09:17:41 125人关注
在 AI 的世界里,数据就像是金矿,越丰富越闪亮。最近,LLM360推出了一个令人瞩目的数据集 TxT360,专为大语言模型训练量身定做。这个庞然大物不仅收录了来自各行各业的高质量文本数据,更是经历了一场全球范围的去重大作战,最终汇聚成5.7万亿个优质 tokens,真可谓是 “数据界的百宝箱”!
2024-12-20 09:43:33 32人关注
在人工智能领域,规模越大似乎就意味着能力越强。为了追求更强大的语言模型,各大科技公司都在疯狂堆叠模型参数和训练数据,结果却发现成本也随之水涨船高。难道就没有一种既经济又高效的方法来训练语言模型吗?
语言模型训练 训练精度 大模型训练技术 模型训练优化 语言模型优化方法