上云资讯 - 来上云吧，企业上云一站式服务

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-04-28 10:24:34 454人关注

全球最快推理速度模型！Qafind Labs 发布 ChatDLM 技术

近日，Qafind Labs发布了其最新研发的ChatDLM模型，这一创新成果在人工智能领域引起了广泛关注。ChatDLM是首个将“区块扩散（Block Diffusion）”和“专家混合(MoE)”深度融合的模型，其在GPU上实现了惊人的2，800tokens/s超高推理速度，支持131，072tokens的超大上下文窗口，开启了文档级生成和实时对话的新纪元。

fastest inference model ChatDLM QAFind 模型推理速度优化高效推理技术

- 上云资讯 -

全球最快推理速度模型！Qafind Labs 发布 ChatDLM 技术

推荐阅读

上云服务