- 上云资讯 -
2025-05-03 10:19:39 464人关注
Unsloth发布Qwen3动态量化2.0版本,优化本地运行体验
Unsloth宣布推出Qwen3的动态量化2.0版本(Dynamic2.0Quants),为显存受限的用户提供了高效的本地运行解决方案。据AIbase了解,新版本通过改进的量化技术,在保持高准确度的同时显著降低显存需求,引发社交平台广泛关注。Unsloth还同步发布了详细的本地运行教程,强调温度(Temperature)参数设置的重要性,以避免推理循环问题。相关细节已通过Hugging Face(huggingface.co/unsloth)与Unsloth官网(unsloth.ai)公开。
2025-04-21 16:15:23 55人关注
谷歌发布 Gemma 3 QAT 模型:一张3090显卡也能轻松驾驭
谷歌近期推出了 Gemma3系列的全新版本,这一消息让众多 AI 爱好者为之振奋。仅在上线一个月后,谷歌便发布了经过量化感知训练(QAT)优化的 Gemma3,旨在显著降低内存需求的同时,保持模型的高质量。
Google Gemma 3 QAT(量化感知训练) RTX 3090 训练优化 大模型量化技术 Google Gemma 3 性能优化