- 上云资讯 -
2025-03-09 10:32:11 171人关注
新开普:星普大模型表现出色,算力消耗显著降低
在最近的一次机构电话交流会上,新开普公司透露了其自研的星普大模型的最新测评结果。该模型采用了 SFT(监督微调)与 RL(强化学习)的训练技术,在智能推理效果上与 DeepSeek-R1相近,且算力消耗仅为 DeepSeek-R1的1/20。这一成果不仅彰显了新开普在人工智能领域的研发实力,同时也为降低硬件投入提供了可能。
2025-01-23 13:23:33 53人关注
苹果与NVIDIA联手提升AI模型生产效率,速度提升近三倍
近日,苹果公司在机器学习领域的最新研究显示,他们通过与 NVIDIA 的合作,成功将大型语言模型(LLM)的生成速度提高了近三倍。这一进展的关键在于苹果开源的技术 “Recurrent Drafter”(ReDrafter),它采用了一种推测解码方法,能够显著提升模型训练的效率。
2024-12-31 20:28:14 58人关注
OpenAI 新模型 o1 声称能 “完美” 纠正偏见,但数据并不完全支持
近日,OpenAI 的全球事务副总裁安娜・马坎朱(Anna Makanju)在联合国 “未来峰会” 上发表了一番关于人工智能偏见的看法。
2024-12-25 03:24:43 49人关注
Meta AI新量化版本Llama 3.2:速度提高2倍、体量减少56%,手机就能运行
最近,Meta AI 推出了全新的量化 Llama3.2模型,包含1B 和3B 两个版本,这款模型可以在多种设备上进行微调、蒸馏和部署。