LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-05-30 10:16:17 48人关注

通义新一代轻量化大语言模型DistilQwen2.5 发布 提升性能与效率

在大语言模型逐渐普及的今天,如何在资源受限的环境中实现高效部署已成为重要课题。为了解决这一挑战,基于 Qwen2.5的轻量化大模型系列 DistilQwen2.5正式发布。该模型采用了创新的双层蒸馏框架,通过优化数据和参数融合技术,不仅保留了模型的性能,同时显著降低了计算资源的消耗。

轻量级语言模型 DistilQwen2-5模型发布 语言模型优化 模型轻量化技术 AI模型压缩方法

2025-01-03 09:26:15 71人关注

无标记化的语言模型T-FREE 像施了魔法一样高效!

研究团队最近带来了一个令人兴奋的新方法,叫做 T-FREE,让大型语言模型的运作效率直线上升。来自 Aleph Alpha、达姆施塔特工业大学、hessian.AI 和德国人工智能研究中心(DFKI)的科学家们联合推出了这个令人惊叹的技术,它的全名是 “无需标记器的稀疏表示,可实现内存高效嵌入”。

高效语言模型 免费语言模型 语言模型技术 语言模型应用场景 语言模型优化技巧

2024-12-20 09:43:33 73人关注

颠覆认知!语言模型训练精度并非越高越好?7-8 位精度才是王道?

在人工智能领域,规模越大似乎就意味着能力越强。为了追求更强大的语言模型,各大科技公司都在疯狂堆叠模型参数和训练数据,结果却发现成本也随之水涨船高。难道就没有一种既经济又高效的方法来训练语言模型吗?

语言模型训练 训练精度 大模型训练技术 模型训练优化 语言模型优化方法

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10