- 上云资讯 -
2025-07-16 15:32:13 346人关注
Unsloth AI发布1.8bit量化Kimi K2模型,显著降低部署成本
7月14日,Unsloth AI宣布成功将Moonshot AI的Kimi K2模型量化为1.8bit版本,大幅压缩模型体积并降低部署成本。根据AIbase报道,这一技术突破使Kimi K2从原始的1.1TB缩减至245GB,体积减少约80%,同时保持了全部代码测试性能。此举被视为开源AI领域的重要进展,引发了业界广泛关注。
Kimi K2模型量化 1.8bit量化技术 模型体积压缩 开源AI技术进展 Unsloth AI技术突破 AI模型部署成本优化
2025-05-03 10:19:39 833人关注
Unsloth发布Qwen3动态量化2.0版本,优化本地运行体验
Unsloth宣布推出Qwen3的动态量化2.0版本(Dynamic2.0Quants),为显存受限的用户提供了高效的本地运行解决方案。据AIbase了解,新版本通过改进的量化技术,在保持高准确度的同时显著降低显存需求,引发社交平台广泛关注。Unsloth还同步发布了详细的本地运行教程,强调温度(Temperature)参数设置的重要性,以避免推理循环问题。相关细节已通过Hugging Face(huggingface.co/unsloth)与Unsloth官网(unsloth.ai)公开。