上云资讯 - 来上云吧，企业上云一站式服务

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-09-02 09:14:15 306人关注

Nvidia 推出小型开放模型 Nemotron-Nano-9B-v2：可切换的推理功能

近日，Nvidia 正式发布了一款新型小型语言模型 Nemotron-Nano-9B-v2，标志着小型模型的热潮再度升温。

小型语言模型 Nemotron-Nano-9B-v2 Nvidia 新模型发布小型模型热潮 9B 参数模型

2025-08-07 11:26:33 329人关注

阿里新发布Qwen3-4B模型：小巧强劲，手机也能跑 AI！

阿里巴巴通义千问团队推出全新Qwen3-4B系列模型，包括Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507两个版本。这一发布标志着小型语言模型（SLM）技术的重要突破，为移动端AI应用开辟了新的发展路径。

阿里巴巴通义千问 Qwen3-4B系列模型 Qwen3-4B-Instruct-2507 Qwen3-4B-Thinking-2507 小型语言模型SLM技术移动端AI应用

2025-01-15 06:44:26 257人关注

英伟达推出 Minitron 小型语言模型：训练速度提高 40 倍

最近，英伟达（NVIDIA）在人工智能领域又有了新动作，他们推出了 Minitron 系列的小型语言模型，包含4B 和8B 两个版本。这些模型不仅让训练速度提高了整整40倍，还能让开发者更轻松地使用它们进行各种应用，比如翻译、情感分析和对话 AI 等。

NVIDIA Minitron 语言模型训练加速 40倍训练速度提升大模型训练优化 GPU加速训练技术

2025-01-15 00:10:12 242人关注

轻松调优！微软针对Phi-3小型语言模型推出无服务器微调功能

近日，微软宣布推出针对其Phi-3小型语言模型的无服务器微调功能。这一新功能将帮助开发者在无需管理自己的服务器的情况下，轻松调整和优化Phi-3模型的性能。

微软Phi3 无服务器微调大模型微调技术 Phi3模型优化微软AI模型应用

2025-01-09 07:32:13 342人关注

Llama3压缩版！Nvidia推小型语言模型Llama-3.1-Minitron4B 仅4亿参数

在如今科技公司纷纷追逐在设备上实现人工智能的时代，越来越多的小型语言模型（SLM）应运而生，能够在资源受限的设备上运行。最近，Nvidia 的研究团队利用前沿的模型剪枝和蒸馏技术，推出了 Llama-3.1-Minitron4B，这是 Llama3模型的压缩版本。这个新模型在性能上不仅可以与更大的模型媲美，还能与同等规模的小型模型竞争，同时在训练和部署上都显得更加高效。

Llama3 Mini Llama 3 Minitron 4b 大模型技术大模型技术原理

2024-12-28 08:32:19 242人关注

号称最先进小型语言模型Zamba2-7B发布性能超越Gemma-7B

最近，Zyphra 正式推出了 Zamba2-7B，这是一款具有前所未有性能的小型语言模型，参数数量达到7B。

Zamba2-7B Gemma-7B 大模型性能对比开源大模型评测模型性能优化

2024-12-22 12:44:25 279人关注

Hugging Face发布SmolLM2：小型语言模型挑战行业巨头

Hugging Face今天发布了SmolLM2，一组新的紧凑型语言模型，实现了令人印象深刻的性能，同时所需的计算资源比大型模型少得多。新模型采用Apache2.0许可发布，有三种大小——135M、360M和1.7B参数——适合部署在智能手机和其他处理能力和内存有限的边缘设备上。

Hugging Face SmolLM2 小语言模型语言模型技术小模型优化模型训练技巧

- 上云资讯 -

Nvidia 推出小型开放模型 Nemotron-Nano-9B-v2：可切换的推理功能

阿里新发布Qwen3-4B模型：小巧强劲，手机也能跑 AI！

英伟达推出 Minitron 小型语言模型：训练速度提高 40 倍

轻松调优！微软针对Phi-3小型语言模型推出无服务器微调功能

Llama3压缩版！Nvidia推小型语言模型Llama-3.1-Minitron4B 仅4亿参数

号称最先进小型语言模型Zamba2-7B发布性能超越Gemma-7B

Hugging Face发布SmolLM2：小型语言模型挑战行业巨头

推荐阅读

上云服务

- 上云资讯 -

​Nvidia 推出小型开放模型 Nemotron-Nano-9B-v2：可切换的推理功能

阿里新发布Qwen3-4B模型：小巧强劲，手机也能跑 AI！

​英伟达推出 Minitron 小型语言模型：训练速度提高 40 倍

​轻松调优！微软针对Phi-3小型语言模型推出无服务器微调功能

Llama3压缩版！Nvidia推小型语言模型Llama-3.1-Minitron4B 仅4亿参数

号称最先进小型语言模型Zamba2-7B发布 性能超越Gemma-7B

Hugging Face发布SmolLM2：小型语言模型挑战行业巨头

推荐阅读

上云服务

Nvidia 推出小型开放模型 Nemotron-Nano-9B-v2：可切换的推理功能

英伟达推出 Minitron 小型语言模型：训练速度提高 40 倍

轻松调优！微软针对Phi-3小型语言模型推出无服务器微调功能

号称最先进小型语言模型Zamba2-7B发布性能超越Gemma-7B