LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-05-03 10:19:39 830人关注

Unsloth发布Qwen3动态量化2.0版本,优化本地运行体验

Unsloth宣布推出Qwen3的动态量化2.0版本(Dynamic2.0Quants),为显存受限的用户提供了高效的本地运行解决方案。据AIbase了解,新版本通过改进的量化技术,在保持高准确度的同时显著降低显存需求,引发社交平台广泛关注。Unsloth还同步发布了详细的本地运行教程,强调温度(Temperature)参数设置的重要性,以避免推理循环问题。相关细节已通过Hugging Face(huggingface.co/unsloth)与Unsloth官网(unsloth.ai)公开。

Unsloth Qwen3 动态量化 AI模型优化 大模型量化技术

2025-04-21 16:15:23 120人关注

谷歌发布 Gemma 3 QAT 模型:一张3090显卡也能轻松驾驭

谷歌近期推出了 Gemma3系列的全新版本,这一消息让众多 AI 爱好者为之振奋。仅在上线一个月后,谷歌便发布了经过量化感知训练(QAT)优化的 Gemma3,旨在显著降低内存需求的同时,保持模型的高质量。

Google Gemma 3 QAT(量化感知训练) RTX 3090 训练优化 大模型量化技术 Google Gemma 3 性能优化

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10