- 上云资讯 -
2025-10-21 11:38:43 276人关注
颠覆LLM长文本处理!DeepSeek-OCR发布“视觉记忆压缩”机制,或破解AI记忆瓶颈
近日,DeepSeek发布了全新的OCR文档理解模型——DeepSeek-OCR。该模型不仅在图像文档解析方面取得了顶级性能,更引入了一个大胆且极具创新性的概念:“视觉记忆压缩”机制,旨在革命性地解决大型语言模型(LLM)在处理超长上下文时计算资源爆炸性增长的难题。
2025-09-30 09:20:44 55人关注
京东重磅推出国产芯片驱动的 xLLM 推理引擎
京东最近宣布了一项令人振奋的技术进展 —— 开源基于国产芯片自主研发的大模型推理引擎 xLLM。这一引擎的推出旨在帮助企业在部署人工智能(AI)应用时,能够以更高的性能和更低的成本运作,进一步推动行业的智能化转型。
2025-09-26 12:37:44 180人关注
LLM编码幻觉终结者!Exa Code发布,亿级代码索引让AI代理零失误
Exa Labs近日推出Exa Code,这款专为Coding Agent优化的网络上下文工具,通过索引超过10亿个文档页面、GitHub仓库和StackOverflow帖子,提供高效、精确的代码上下文,帮助大型语言模型(LLM)避免生成错误代码。该工具在代码幻觉评估中,表现超越市面上所有网络搜索工具,包括Exa自身,已免费开源,迅速引发开发者社区热议。
2025-09-20 18:14:29 79人关注
解锁 LLM Agent 力量!Anthropic 发布工具编写指南,助你玩转大语言模型!
近日,人工智能公司 Anthropic 在其官方博客上发布了一份重磅指南《Writing effective tools for LLM agents—using LLM agents》。这份指南详细阐述了如何利用 Model Context Protocol(MCP)为大语言模型(LLM)代理(Agent)设计高效工具,提供了一个系统化的 “原型 - 评估 - 协作” 三步迭代流程,旨在帮助开发者更好地构建和优化工具。
2025-09-20 17:14:12 120人关注
Anthropic 发布 LLM Agent 工具编写指南,助力开发者提升效率
近日,Anthropic 官方博客发布了一份详尽的指南,题为《Writing effective tools for LLM agents—using LLM agents》。该指南旨在帮助开发者利用 Model Context Protocol(MCP)为 LLM Agent 设计高效的工具。文中提出了 “原型 - 评估 - 协作” 三步迭代流程,并总结了五大设计原则,以确保工具的有效性和可用性。
2025-09-19 09:18:29 129人关注
Meta 推出小型推理模型MobileLLM-R1,企业应用向 “小型 AI” 转型
近期,Meta 公司推出了一款名为 MobileLLM-R1的小型推理模型,引发了业界对 “小型 AI” 在企业应用中的关注。以往,人工智能模型的强大能力往往与其庞大的参数规模相关,许多模型的参数量达到数百亿甚至数万亿。
2025-09-16 17:17:32 111人关注
Meta AI 发布 MobileLLM-R1:轻量级边缘推理模型,参数不足 10 亿,性能提升显著
Meta AI 近日推出了 MobileLLM-R1,这是一系列轻量级边缘推理模型,目前已在 Hugging Face 上发布。该系列模型参数范围从140M 到950M,专注于高效的数学、编码和科学推理,且在不足10亿的参数规模下实现了优秀的性能表现。
2025-09-16 12:25:32 66人关注
新工具来袭!BentoML发布llm-optimizer,助你轻松优化LLM推理性能
近日,知名开源项目 BentoML 推出了一款名为 llm-optimizer 的全新工具,旨在为开发者提供一种简单而高效的方法来优化大型语言模型(LLM)的推理性能。随着人工智能技术的迅速发展,LLM 的应用也越来越广泛,如何高效地部署和使用这些模型成为了不少开发者面临的挑战。llm-optimizer 的推出,无疑为这一问题提供了极具价值的解决方案。
2025-09-12 17:18:45 118人关注
挑战主流认知!蚂蚁、人大在2025外滩大会发布行业首个原生MoE扩散语言模型
蚂蚁集团和人民大学联合研发原生MoE架构扩散语言模型(dLLM) LLaDA-MoE,在约20T数据上完成了从零训练MoE架构的扩散语言模型,验证了工业级大规模训练的扩展性和稳定性;效果超过此前发布稠密扩散语言模型LLaDA1.0/1.5和Dream-7B,比肩等效自回归模型,并保有数倍的推理速度优势。模型将在近期完全开源,以推动全球AI社区在dLLM上的技术发展。
MoE架构扩散语言模型 LLaDA-MoE模型开源 dLLM技术发展 工业级大规模训练 扩散语言模型推理速度优势 AI社区技术推动
2025-09-11 16:13:29 171人关注
重磅!月之暗面开源革命性中间件 “Checkpoint Engine”,为 LLM 推理引擎带来新生机!
在人工智能领域,尤其是在大规模语言模型(LLM)的推理与训练中,模型权重的实时更新一直是一个技术挑战。最近,月之暗面(MoonshotAI)开源了一个名为 “Checkpoint Engine” 的新中间件,专为 LLM 推理引擎而设计。这一创新工具的发布,标志着在强化学习等应用场景中,模型的权重可以实现更为高效的原地热更新。
2025-09-04 13:22:41 229人关注
Meta 推出 DeepConf 技术,智能平衡大型语言模型的推理成本与准确性
近日,Meta AI 联合加州大学圣地亚哥分校(UCSD)推出了一种名为 Deep Think with Confidence(DeepConf) 的新技术,旨在帮助企业在大语言模型(LLM)的复杂推理任务中,有效降低算力成本的同时保持高准确率 。
大语言模型推理优化 DeepConf 技术解析 LLM 算力成本降低 复杂推理任务效率提升 Meta AI 与 UCSD 合作研究 企业级 AI 应用优化
2025-08-18 16:11:12 73人关注
人工智能能否真正构建软件?Zed 编辑器团队给出了答案!
开源代码编辑器 Zed 的开发团队发布了一篇引人关注的博文,题为《为什么 LLM 无法真正构建软件》。这篇文章由 Conrad Irwin 撰写,迅速引发了技术圈的热烈讨论,尤其是在 Hacker News 上,众多开发者纷纷发表看法,聚焦于 AI 辅助编程的本质。
开源代码编辑器 LLM 构建软件 AI 辅助编程本质 Zed 开发团队观点 Conrad Irwin 博文 Hacker News 技术讨论
2025-08-14 10:18:34 143人关注
微软重磅推出POML!全新AI标记语言颠覆提示工程,未来还是XML翻版?
近日,微软推出了一款全新的提示编排标记语言(POML,Prompt Orchestration Markup Language),专为大型语言模型(LLMs)的提示工程设计。据AIbase综合整理的网络信息,POML旨在解决传统提示开发中的痛点,通过结构化、可维护的方式提升AI应用的开发效率。然而,这一新语言是否只是XML的“翻版”,以及其复杂性是否会削弱实用性,引发了社区热议。
2025-08-13 13:18:18 90人关注
Anthropic 重磅升级!Claude Sonnet 4 模型可支持100万词元
人工智能初创公司 Anthropic 今天宣布,他们备受欢迎的 Claude Sonnet4语言模型(LLM)现已支持高达100万个上下文词元。这一更新使 Anthropic 成为继 Google Gemini 之后,第二家能提供如此长上下文支持的主流模型供应商。
AI大模型 Claude Sonnet4语言模型 Anthropic公司 上下文词元支持 LLM技术突破 Google Gemini竞争对手
2025-08-12 13:21:14 89人关注
英特尔发布 LLM-Scaler1.0,助力 AI 推理性能提升
英特尔于2025年8月宣布了其 “战斗矩阵” 项目的最新软件更新,并推出了 LLM-Scaler1.0容器,以优化 Intel Arc B 系列显卡的 AI 推理支持。
英特尔战斗矩阵项目 LLM-Scaler1.0容器 Intel Arc B系列显卡 AI推理优化 2025年英特尔软件更新
2025-08-09 13:30:27 312人关注
腾讯 WeKnora 开源:你的文档管理难题,让 AI 来解决
在信息爆炸的时代,处理复杂的文档资料一直是企业和研究者面临的挑战。现在,腾讯开源了一款基于大型语言模型(LLM)的全新文档理解与检索工具 WeKnora,旨在帮助用户高效地从 PDF、Word、图片等多种格式文档中提取和整合信息,构建统一的语义视图。
2025-08-09 10:29:23 138人关注
PyTorch 2.8重磅发布:量化LLM推理性能飞跃,Intel GPU 支持来袭!
近日,开源机器学习框架 PyTorch 迎来了全新版本2.8的正式发布。这一版本的发布备受关注,主要集中在提升量化大语言模型(LLM)的推理性能,尤其是在 Intel CPU 上的表现。此次更新不仅显著增强了在离线模式下的推理效率,还首次实验性支持了 Intel GPU 的分布式后端。
PyTorch 2.8 新特性 量化大语言模型推理性能提升 Intel CPU 推理优化 离线模式推理效率 Intel GPU 分布式后端支持 PyTorch 量化 LLM 优化
2025-07-25 12:43:32 263人关注
开源AI工具DailiCode横空出世:兼容多LLM模型,重构开发者工作流
近日,一款名为DailiCode的开源AI Agent CLI工具在GitHub引发关注。作为Gemini CLI的Fork版本,该工具以强大的多模型兼容性和丰富功能,为开发者打造了高效便捷的命令行AI助手新体验。
