- 上云资讯 -
2025-04-28 10:24:34 70人关注
全球最快推理速度模型!Qafind Labs 发布 ChatDLM 技术
近日,Qafind Labs发布了其最新研发的ChatDLM模型,这一创新成果在人工智能领域引起了广泛关注。ChatDLM是首个将“区块扩散(Block Diffusion)”和“专家混合(MoE)”深度融合的模型,其在GPU上实现了惊人的2,800tokens/s超高推理速度,支持131,072tokens的超大上下文窗口,开启了文档级生成和实时对话的新纪元。
2024-12-19 02:24:19 50人关注
阿里云发布逆天大模型Qwen2.5-Turbo 一口气读完十本小说,推理速度提升4.3倍!
阿里云重磅推出全新升级的Qwen2.5-Turbo大语言模型,其上下文长度突破至惊人的100万Token。这相当于什么概念?相当于10部《三体》,150小时的语音转录或3万行代码的容量!这回可真是“一口气读完十本小说”不是梦了!
阿里云通义千问2.5 Turbo模型 大模型推理速度优化 大模型阅读性能提升 通义千问2.5 Turbo技术解析 AI大模型性能优化