- 上云资讯 -
2025-07-10 14:38:14 100人关注
Hugging Face重磅开源SmolLM3:3B参数小模型媲美4B巨头,128K上下文引领高效AI新风潮!
近日,Hugging Face正式推出全新开源语言模型 SmolLM3,一款拥有3B参数的轻量级大语言模型(LLM),以其卓越性能和高效设计引发行业广泛关注。SmolLM3不仅在多项基准测试中超越同级别的Llama-3.2-3B和Qwen2.5-3B,甚至与更大规模的4B参数模型Gemma3性能相当。
Hugging Face SmolLM3 开源语言模型 轻量级大语言模型 3B参数模型 SmolLM3性能评测 SmolLM3基准测试
2025-07-09 11:38:27 81人关注
Hugging Face发布新一代小参数模型 SmolLM3:128K上下文,双模式推理
近日,全球知名的大模型开放平台 Hugging Face 正式发布了其最新开源模型 ——SmolLM3。这款模型拥有30亿参数,尽管参数量相对较小,但其性能显著超过了同类的开源模型,如 Llama-3.2-3B 和 Qwen2.5-3B。
Hugging Face最新开源模型 SmolLM3性能优势 30亿参数大模型 开源模型对比评测 小参数高性能模型 Hugging Face模型发布
2025-06-04 10:23:39 1019人关注
DeepSeek R1-0528震撼发布:免费128K上下文,性能直逼OpenAI o3!
作为AI领域的先锋力量,DeepSeek再次以其技术突破引发行业热议。2025年5月28日,DeepSeek悄然发布了R1-0528版本,这一更新不仅在性能上实现大幅跃升,还以免费开放的姿态震撼市场。本文由AIbase编辑部整理最新信息,带您深入了解这一版本的亮点与潜力。
2024-12-19 10:34:10 108人关注
超越Gemma2!IBM发布Granite3.1模型:支持128K上下文长度
IBM 正式发布了其新一代开源大语言模型 Granite3.1,力图在企业级 AI 领域占据领先地位。这一系列模型具备128K 的扩展上下文长度、嵌入模型、内置的幻觉检测功能以及性能的显著提升。