- 上云资讯 -
2025-07-10 14:38:14 100人关注
Hugging Face重磅开源SmolLM3:3B参数小模型媲美4B巨头,128K上下文引领高效AI新风潮!
近日,Hugging Face正式推出全新开源语言模型 SmolLM3,一款拥有3B参数的轻量级大语言模型(LLM),以其卓越性能和高效设计引发行业广泛关注。SmolLM3不仅在多项基准测试中超越同级别的Llama-3.2-3B和Qwen2.5-3B,甚至与更大规模的4B参数模型Gemma3性能相当。
Hugging Face SmolLM3 开源语言模型 轻量级大语言模型 3B参数模型 SmolLM3性能评测 SmolLM3基准测试
2025-01-24 01:20:26 126人关注
IBM发布更新版Granite 3.1开源语言模型,性能大幅提升
近日,IBM 宣布推出其开源语言模型 Granite 的3.1版本,此次更新带来了诸多重要改进。新版本的模型经过重新设计,采用了更加密集的架构,能够一次处理多达128,000个令牌。这一更新意味着 Granite 在处理复杂文本和任务时的能力得到了显著增强。
2025-01-16 08:31:36 67人关注
苹果AI发布7亿参数开源语言模型DCLM 准确率提高、计算资源占用降低
最近,苹果公司的人工智能团队和华盛顿大学等多家机构合作,推出一款名叫 DCLM的开源语言模型。这款模型的参数达7亿,并且在训练过程中使用了多达2.5万亿个数据令牌,帮助我们更好地理解和生成语言。
2025-01-16 04:13:25 119人关注
Arcee AI发布开源语言模型Arcee-Nova:基于Qwen2-72B 性能接近 GPT-4
最近,Arcee AI 正式推出了其最新的开源语言模型 ——Arcee-Nova。这一新模型基于 Qwen2-72B-Instruct,迅速在开源领域中崭露头角,成为表现最优异的模型之一。经过评估,Arcee-Nova 的表现几乎达到了2023年5月的 GPT-4水准,这不仅标志着 Arcee AI 的一个重要里程碑,也为整个 AI 社区带来了新的希望。