- 上云资讯 -
2025-09-02 09:14:15 60人关注
Nvidia 推出小型开放模型 Nemotron-Nano-9B-v2:可切换的推理功能
近日,Nvidia 正式发布了一款新型小型语言模型 Nemotron-Nano-9B-v2,标志着小型模型的热潮再度升温。
2025-08-07 11:26:33 118人关注
阿里新发布Qwen3-4B模型:小巧强劲,手机也能跑 AI!
阿里巴巴通义千问团队推出全新Qwen3-4B系列模型,包括Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507两个版本。这一发布标志着小型语言模型(SLM)技术的重要突破,为移动端AI应用开辟了新的发展路径。
阿里巴巴通义千问 Qwen3-4B系列模型 Qwen3-4B-Instruct-2507 Qwen3-4B-Thinking-2507 小型语言模型SLM技术 移动端AI应用
2025-01-15 06:44:26 130人关注
英伟达推出 Minitron 小型语言模型:训练速度提高 40 倍
最近,英伟达(NVIDIA)在人工智能领域又有了新动作,他们推出了 Minitron 系列的小型语言模型,包含4B 和8B 两个版本。这些模型不仅让训练速度提高了整整40倍,还能让开发者更轻松地使用它们进行各种应用,比如翻译、情感分析和对话 AI 等。
2025-01-09 07:32:13 205人关注
Llama3压缩版!Nvidia推小型语言模型Llama-3.1-Minitron4B 仅4亿参数
在如今科技公司纷纷追逐在设备上实现人工智能的时代,越来越多的小型语言模型(SLM)应运而生,能够在资源受限的设备上运行。最近,Nvidia 的研究团队利用前沿的模型剪枝和蒸馏技术,推出了 Llama-3.1-Minitron4B,这是 Llama3模型的压缩版本。这个新模型在性能上不仅可以与更大的模型媲美,还能与同等规模的小型模型竞争,同时在训练和部署上都显得更加高效。