LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-07-10 14:38:14 100人关注

Hugging Face重磅开源SmolLM3:3B参数小模型媲美4B巨头,128K上下文引领高效AI新风潮!

近日,Hugging Face正式推出全新开源语言模型 SmolLM3,一款拥有3B参数的轻量级大语言模型(LLM),以其卓越性能和高效设计引发行业广泛关注。SmolLM3不仅在多项基准测试中超越同级别的Llama-3.2-3B和Qwen2.5-3B,甚至与更大规模的4B参数模型Gemma3性能相当。

Hugging Face SmolLM3 开源语言模型 轻量级大语言模型 3B参数模型 SmolLM3性能评测 SmolLM3基准测试

2025-07-09 11:38:27 81人关注

Hugging Face发布新一代小参数模型 SmolLM3:128K上下文,双模式推理

近日,全球知名的大模型开放平台 Hugging Face 正式发布了其最新开源模型 ——SmolLM3。这款模型拥有30亿参数,尽管参数量相对较小,但其性能显著超过了同类的开源模型,如 Llama-3.2-3B 和 Qwen2.5-3B。

Hugging Face最新开源模型 SmolLM3性能优势 30亿参数大模型 开源模型对比评测 小参数高性能模型 Hugging Face模型发布

2025-06-04 10:23:39 1019人关注

DeepSeek R1-0528震撼发布:免费128K上下文,性能直逼OpenAI o3!

作为AI领域的先锋力量,DeepSeek再次以其技术突破引发行业热议。2025年5月28日,DeepSeek悄然发布了R1-0528版本,这一更新不仅在性能上实现大幅跃升,还以免费开放的姿态震撼市场。本文由AIbase编辑部整理最新信息,带您深入了解这一版本的亮点与潜力。

DeepSeek R1 128k上下文 免费大模型 DeepSeek新闻 大模型技术更新

2024-12-19 10:34:10 108人关注

超越Gemma2!​IBM发布Granite3.1模型:支持128K上下文长度

IBM 正式发布了其新一代开源大语言模型 Granite3.1,力图在企业级 AI 领域占据领先地位。这一系列模型具备128K 的扩展上下文长度、嵌入模型、内置的幻觉检测功能以及性能的显著提升。

IBM Granite31 128k上下文窗口 大模型上下文扩展 IBM大模型技术 长文本处理技术

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10