LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-09-02 09:14:15 60人关注

​Nvidia 推出小型开放模型 Nemotron-Nano-9B-v2:可切换的推理功能

近日,Nvidia 正式发布了一款新型小型语言模型 Nemotron-Nano-9B-v2,标志着小型模型的热潮再度升温。

小型语言模型 Nemotron-Nano-9B-v2 Nvidia 新模型发布 小型模型热潮 9B 参数模型

2025-08-07 11:26:33 118人关注

阿里新发布Qwen3-4B模型:小巧强劲,手机也能跑 AI!

阿里巴巴通义千问团队推出全新Qwen3-4B系列模型,包括Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507两个版本。这一发布标志着小型语言模型(SLM)技术的重要突破,为移动端AI应用开辟了新的发展路径。

阿里巴巴通义千问 Qwen3-4B系列模型 Qwen3-4B-Instruct-2507 Qwen3-4B-Thinking-2507 小型语言模型SLM技术 移动端AI应用

2025-01-15 06:44:26 130人关注

​英伟达推出 Minitron 小型语言模型:训练速度提高 40 倍

最近,英伟达(NVIDIA)在人工智能领域又有了新动作,他们推出了 Minitron 系列的小型语言模型,包含4B 和8B 两个版本。这些模型不仅让训练速度提高了整整40倍,还能让开发者更轻松地使用它们进行各种应用,比如翻译、情感分析和对话 AI 等。

NVIDIA Minitron 语言模型训练加速 40倍训练速度提升 大模型训练优化 GPU加速训练技术

2025-01-15 00:10:12 106人关注

​轻松调优!微软针对Phi-3小型语言模型推出无服务器微调功能

近日,微软宣布推出针对其Phi-3小型语言模型的无服务器微调功能。这一新功能将帮助开发者在无需管理自己的服务器的情况下,轻松调整和优化Phi-3模型的性能。

微软Phi3 无服务器微调 大模型微调技术 Phi3模型优化 微软AI模型应用

2025-01-09 07:32:13 205人关注

Llama3压缩版!Nvidia推小型语言模型Llama-3.1-Minitron4B 仅4亿参数

在如今科技公司纷纷追逐在设备上实现人工智能的时代,越来越多的小型语言模型(SLM)应运而生,能够在资源受限的设备上运行。最近,Nvidia 的研究团队利用前沿的模型剪枝和蒸馏技术,推出了 Llama-3.1-Minitron4B,这是 Llama3模型的压缩版本。这个新模型在性能上不仅可以与更大的模型媲美,还能与同等规模的小型模型竞争,同时在训练和部署上都显得更加高效。

Llama3 Mini Llama 3 Minitron 4b 大模型技术 大模型技术原理

2024-12-28 08:32:19 82人关注

号称最先进小型语言模型Zamba2-7B发布 性能超越Gemma-7B

最近,Zyphra 正式推出了 Zamba2-7B,这是一款具有前所未有性能的小型语言模型,参数数量达到7B。

Zamba2-7B Gemma-7B 大模型性能对比 开源大模型评测 模型性能优化

2024-12-22 12:44:25 100人关注

Hugging Face发布SmolLM2:小型语言模型挑战行业巨头

Hugging Face今天发布了SmolLM2,一组新的紧凑型语言模型,实现了令人印象深刻的性能,同时所需的计算资源比大型模型少得多。新模型采用Apache2.0许可发布,有三种大小——135M、360M和1.7B参数——适合部署在智能手机和其他处理能力和内存有限的边缘设备上。

Hugging Face SmolLM2 小语言模型 语言模型技术 小模型优化 模型训练技巧

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10