LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-09-02 08:16:39 183人关注

美团发布 LongCat-Flash-Chat:560B 参数模型再创新高,智能体表现惊艳!

近日,美团正式发布并开源了其最新的 AI 大模型 ——LongCat-Flash-Chat。这款模型以560B 的总参数量和18.6B 到31.3B 的激活参数范围,展现了其在计算效率与性能之间的优越平衡。LongCat-Flash 采用了创新的混合专家模型(MoE)架构,利用 “零计算专家” 机制,使得每个 token 在处理时仅激活必要的参数,确保算力高效利用。

美团AI大模型 LongCat-Flash-Chat 混合专家模型架构 MoE架构优势 零计算专家机制 大模型参数优化

2025-01-16 16:18:10 125人关注

微软Q-Sparse模型:8B参数性能直逼7B模型 训练微调轻松搞定!

在人工智能的世界里,大型语言模型(LLMs)以其卓越的自然语言处理能力而著称。然而,这些模型在实际应用中的部署却面临着巨大的挑战,主要是因为它们在推理阶段的高计算成本和内存占用。为了解决这一问题,研究人员们一直在探索如何提高LLMs的效率。最近,一种名为Q-Sparse的方法引起了广泛关注。

Microsoft Q-Sparse模型 8B参数大模型 稀疏模型技术 大模型参数优化 微软AI模型创新

2025-01-15 03:14:40 111人关注

智源研究院开源全球首个万亿单体稠密模型Tele-FLM-1T

北京智源人工智能研究院和中国电信人工智能研究院(TeleAI)联合研发的Tele-FLM系列大模型最近进行了升级,发布了52B指令模型FLM-2-52B-Instruct和全球首个万亿单体稠密模型Tele-FLM-1T,并将相关技术报告和模型的checkpoint开源。

万亿参数大模型 密集模型技术 FLM大模型架构 Tele-FLM模型解析 大模型参数优化

2024-12-11 12:31:16 119人关注

京东发布10大AI营销工具,最高模型规模达810亿参数

在人工智能快速发展的今天,京东云正在用实际行动诠释技术创新的力量。近日,京东云发布了言犀智能营销平台,推出十大AI营销产品,为超80万商家提供智能化解决方案,展现了AI技术在产业落地中的巨大潜力。

京东AI营销工具 810B参数大模型 AI营销技术 大模型参数优化 AI营销工具应用场景

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10