- 上云资讯 -
2025-01-15 06:44:26 101人关注
英伟达推出 Minitron 小型语言模型:训练速度提高 40 倍
最近,英伟达(NVIDIA)在人工智能领域又有了新动作,他们推出了 Minitron 系列的小型语言模型,包含4B 和8B 两个版本。这些模型不仅让训练速度提高了整整40倍,还能让开发者更轻松地使用它们进行各种应用,比如翻译、情感分析和对话 AI 等。
2025-01-11 18:41:35 151人关注
解决Llama3训练困境!豆包大模型携手港大团队推全新检查点系统 优化训练效率
在一个由数据和算法主导的数字世界里,人工智能的每一步成长都离不开一个关键元素——检查点(Checkpoint)。想象一下,当你正在训练一个能读懂人心、对答如流的大型语言模型时,这个模型聪明绝顶,但也是个"大胃王",需要海量计算资源来"喂饱"它。在训练过程中,如果突然断电或硬件故障,损失将是巨大的。这时,检查点就像一台"时光机",能让一切回到上一个安全状态,继续未完成的任务。
2025-01-10 03:41:37 81人关注
英伟达开源新突破:新模型训练算力节省1.8倍!
全球人工智能的领军企业英伟达(Nvidia)最近开源了两款新型大模型:Nemotron-4-Minitron-4B和Nemotron-4-Minitron-8B。这两个模型的开源,不仅是技术上的一次飞跃,更在AI领域掀起了一场效率革命。