- 上云资讯 -
2025-05-27 10:38:45 194人关注
阿里突破性发布QwenLong-L1-32B:首个强化学习训练的长文本推理模型,性能媲美Claude-3.7
阿里巴巴今日正式发布QwenLong-L1-32B,这是一款专为长上下文推理设计的大型语言模型,标志着AI长文本处理能力的重大突破。该模型在性能表现上超越了o3-mini和Qwen3-235B-A22B,与Claude-3.7-Sonnet-Thinking达到相当水平。
阿里巴巴通义千问L1-32B 强化学习长文本模型 通义千问L1-32B模型 阿里巴巴大模型 长文本处理技术 强化学习模型应用
2025-01-15 17:21:37 197人关注
苹果研究团队出品!LazyLLM:提高LLM长文本推理效率
最近苹果公司的研究团队和 Meta AI 的研究人员联合推出了一项名为 LazyLLM 的新技术,这项技术在提高大型语言模型(LLM)在长文本推理中的效率。
2025-01-02 15:27:22 308人关注
心流2.0版本发布:超越市场主流模型 提供卓越的长文本阅读和理解能力
近日,AI助手心流正式发布2.0版本,新增的「首页精选内容」和「发现」版块为用户提供了更加智能化、个性化的高质量内容服务。这些功能的推出彰显了人工智能平台在生活与工作中的实用价值,尤其是在解决用户困惑与需求方面的强大能力。
2024-12-19 10:34:10 110人关注
超越Gemma2!IBM发布Granite3.1模型:支持128K上下文长度
IBM 正式发布了其新一代开源大语言模型 Granite3.1,力图在企业级 AI 领域占据领先地位。这一系列模型具备128K 的扩展上下文长度、嵌入模型、内置的幻觉检测功能以及性能的显著提升。