上云资讯 - 来上云吧，企业上云一站式服务

2025-10-21 11:38:43 276人关注

颠覆LLM长文本处理！DeepSeek-OCR发布“视觉记忆压缩”机制，或破解AI记忆瓶颈

近日，DeepSeek发布了全新的OCR文档理解模型——DeepSeek-OCR。该模型不仅在图像文档解析方面取得了顶级性能，更引入了一个大胆且极具创新性的概念:“视觉记忆压缩”机制，旨在革命性地解决大型语言模型（LLM）在处理超长上下文时计算资源爆炸性增长的难题。

AI

2025-09-30 09:20:44 55人关注

京东重磅推出国产芯片驱动的 xLLM 推理引擎

京东最近宣布了一项令人振奋的技术进展 —— 开源基于国产芯片自主研发的大模型推理引擎 xLLM。这一引擎的推出旨在帮助企业在部署人工智能（AI）应用时，能够以更高的性能和更低的成本运作，进一步推动行业的智能化转型。

AI

2025-09-26 12:37:44 180人关注

LLM编码幻觉终结者！Exa Code发布，亿级代码索引让AI代理零失误

Exa Labs近日推出Exa Code，这款专为Coding Agent优化的网络上下文工具，通过索引超过10亿个文档页面、GitHub仓库和StackOverflow帖子，提供高效、精确的代码上下文，帮助大型语言模型（LLM）避免生成错误代码。该工具在代码幻觉评估中，表现超越市面上所有网络搜索工具，包括Exa自身，已免费开源，迅速引发开发者社区热议。

AI

2025-09-20 18:14:29 79人关注

解锁 LLM Agent 力量！Anthropic 发布工具编写指南，助你玩转大语言模型！

近日，人工智能公司 Anthropic 在其官方博客上发布了一份重磅指南《Writing effective tools for LLM agents—using LLM agents》。这份指南详细阐述了如何利用 Model Context Protocol（MCP）为大语言模型（LLM）代理（Agent）设计高效工具，提供了一个系统化的 “原型 - 评估 - 协作” 三步迭代流程，旨在帮助开发者更好地构建和优化工具。

AI

2025-09-20 17:14:12 120人关注

Anthropic 发布 LLM Agent 工具编写指南，助力开发者提升效率

近日，Anthropic 官方博客发布了一份详尽的指南，题为《Writing effective tools for LLM agents—using LLM agents》。该指南旨在帮助开发者利用 Model Context Protocol（MCP）为 LLM Agent 设计高效的工具。文中提出了 “原型 - 评估 - 协作” 三步迭代流程，并总结了五大设计原则，以确保工具的有效性和可用性。

AI

2025-09-19 09:18:29 129人关注

Meta 推出小型推理模型MobileLLM-R1，企业应用向 “小型 AI” 转型

近期，Meta 公司推出了一款名为 MobileLLM-R1的小型推理模型，引发了业界对 “小型 AI” 在企业应用中的关注。以往，人工智能模型的强大能力往往与其庞大的参数规模相关，许多模型的参数量达到数百亿甚至数万亿。

AI

2025-09-16 17:17:32 111人关注

Meta AI 发布 MobileLLM-R1：轻量级边缘推理模型，参数不足 10 亿，性能提升显著

Meta AI 近日推出了 MobileLLM-R1，这是一系列轻量级边缘推理模型，目前已在 Hugging Face 上发布。该系列模型参数范围从140M 到950M，专注于高效的数学、编码和科学推理，且在不足10亿的参数规模下实现了优秀的性能表现。

AI

2025-09-16 12:25:32 66人关注

新工具来袭！BentoML发布llm-optimizer，助你轻松优化LLM推理性能

近日，知名开源项目 BentoML 推出了一款名为 llm-optimizer 的全新工具，旨在为开发者提供一种简单而高效的方法来优化大型语言模型（LLM）的推理性能。随着人工智能技术的迅速发展，LLM 的应用也越来越广泛，如何高效地部署和使用这些模型成为了不少开发者面临的挑战。llm-optimizer 的推出，无疑为这一问题提供了极具价值的解决方案。

AI

2025-09-12 17:18:45 118人关注

挑战主流认知！蚂蚁、人大在2025外滩大会发布行业首个原生MoE扩散语言模型

蚂蚁集团和人民大学联合研发原生MoE架构扩散语言模型（dLLM） LLaDA-MoE，在约20T数据上完成了从零训练MoE架构的扩散语言模型，验证了工业级大规模训练的扩展性和稳定性;效果超过此前发布稠密扩散语言模型LLaDA1.0/1.5和Dream-7B，比肩等效自回归模型，并保有数倍的推理速度优势。模型将在近期完全开源，以推动全球AI社区在dLLM上的技术发展。

MoE架构扩散语言模型 LLaDA-MoE模型开源 dLLM技术发展工业级大规模训练扩散语言模型推理速度优势 AI社区技术推动

2025-09-11 16:13:29 171人关注

重磅！月之暗面开源革命性中间件 “Checkpoint Engine”，为 LLM 推理引擎带来新生机！

在人工智能领域，尤其是在大规模语言模型（LLM）的推理与训练中，模型权重的实时更新一直是一个技术挑战。最近，月之暗面(MoonshotAI)开源了一个名为 “Checkpoint Engine” 的新中间件，专为 LLM 推理引擎而设计。这一创新工具的发布，标志着在强化学习等应用场景中，模型的权重可以实现更为高效的原地热更新。

月之暗面 Checkpoint Engine LLM推理引擎模型权重热更新强化学习应用 MoonshotAI开源

2025-09-08 17:39:27 87人关注

Tilde AI 发布开源 TildeOpen LLM：支持多种欧洲语言的超大语言模型

Latvian 语言技术公司 Tilde 于2025年9月3日发布了 TildeOpen LLM，这是一个开源的基础大语言模型（LLM），旨在支持欧洲语言，特别是那些较少被代表的国家和地区语言。这一举措标志着欧盟在语言公平和数字主权方面迈出了重要的一步。

TildeOpen LLM 开源大语言模型欧洲语言支持语言公平数字主权欧盟语言技术

2025-09-04 13:22:41 229人关注

Meta 推出 DeepConf 技术，智能平衡大型语言模型的推理成本与准确性

近日，Meta AI 联合加州大学圣地亚哥分校（UCSD）推出了一种名为 Deep Think with Confidence（DeepConf）的新技术，旨在帮助企业在大语言模型（LLM）的复杂推理任务中，有效降低算力成本的同时保持高准确率。

大语言模型推理优化 DeepConf 技术解析 LLM 算力成本降低复杂推理任务效率提升 Meta AI 与 UCSD 合作研究企业级 AI 应用优化

2025-08-18 16:11:12 73人关注

人工智能能否真正构建软件？Zed 编辑器团队给出了答案！

开源代码编辑器 Zed 的开发团队发布了一篇引人关注的博文，题为《为什么 LLM 无法真正构建软件》。这篇文章由 Conrad Irwin 撰写，迅速引发了技术圈的热烈讨论，尤其是在 Hacker News 上，众多开发者纷纷发表看法，聚焦于 AI 辅助编程的本质。

开源代码编辑器 LLM 构建软件 AI 辅助编程本质 Zed 开发团队观点 Conrad Irwin 博文 Hacker News 技术讨论

2025-08-14 10:18:34 143人关注

微软重磅推出POML！全新AI标记语言颠覆提示工程，未来还是XML翻版？

近日，微软推出了一款全新的提示编排标记语言（POML，Prompt Orchestration Markup Language），专为大型语言模型(LLMs)的提示工程设计。据AIbase综合整理的网络信息，POML旨在解决传统提示开发中的痛点，通过结构化、可维护的方式提升AI应用的开发效率。然而，这一新语言是否只是XML的“翻版”，以及其复杂性是否会削弱实用性，引发了社区热议。

POML 提示编排标记语言大型语言模型提示工程 LLMs提示设计 AI应用开发效率微软POML技术解析

2025-08-13 13:18:18 90人关注

Anthropic 重磅升级！Claude Sonnet 4 模型可支持100万词元

人工智能初创公司 Anthropic 今天宣布，他们备受欢迎的 Claude Sonnet4语言模型（LLM）现已支持高达100万个上下文词元。这一更新使 Anthropic 成为继 Google Gemini 之后，第二家能提供如此长上下文支持的主流模型供应商。

AI大模型 Claude Sonnet4语言模型 Anthropic公司上下文词元支持 LLM技术突破 Google Gemini竞争对手

2025-08-12 13:21:14 89人关注

英特尔发布 LLM-Scaler1.0，助力 AI 推理性能提升

英特尔于2025年8月宣布了其 “战斗矩阵” 项目的最新软件更新，并推出了 LLM-Scaler1.0容器，以优化 Intel Arc B 系列显卡的 AI 推理支持。

英特尔战斗矩阵项目 LLM-Scaler1.0容器 Intel Arc B系列显卡 AI推理优化 2025年英特尔软件更新

2025-08-09 13:30:27 312人关注

腾讯 WeKnora 开源:你的文档管理难题，让 AI 来解决

在信息爆炸的时代，处理复杂的文档资料一直是企业和研究者面临的挑战。现在，腾讯开源了一款基于大型语言模型（LLM）的全新文档理解与检索工具 WeKnora，旨在帮助用户高效地从 PDF、Word、图片等多种格式文档中提取和整合信息，构建统一的语义视图。

腾讯开源文档工具 WeKnora文档理解 LLM文档检索多格式文档处理语义视图构建

2025-08-09 10:29:23 138人关注

PyTorch 2.8重磅发布：量化LLM推理性能飞跃，Intel GPU 支持来袭！

近日，开源机器学习框架 PyTorch 迎来了全新版本2.8的正式发布。这一版本的发布备受关注，主要集中在提升量化大语言模型（LLM）的推理性能，尤其是在 Intel CPU 上的表现。此次更新不仅显著增强了在离线模式下的推理效率，还首次实验性支持了 Intel GPU 的分布式后端。

PyTorch 2.8 新特性量化大语言模型推理性能提升 Intel CPU 推理优化离线模式推理效率 Intel GPU 分布式后端支持 PyTorch 量化 LLM 优化

2025-07-25 12:43:32 263人关注

开源AI工具DailiCode横空出世:兼容多LLM模型，重构开发者工作流

近日，一款名为DailiCode的开源AI Agent CLI工具在GitHub引发关注。作为Gemini CLI的Fork版本，该工具以强大的多模型兼容性和丰富功能，为开发者打造了高效便捷的命令行AI助手新体验。

开源AI Agent CLI工具 DailiCode Gemini CLI 多模型兼容性命令行AI助手

2025-07-23 16:30:21 199人关注

Meta 推出创新模型 AU-Nets，革新文本处理方式

在大语言模型（LLM）领域，文本数据的分解一直是关键的研究方向。传统的分词技术，如字节对编码(Byte Pair Encoding)，通常在文本处理前将其切割为固定的单元，并基于此构建一个静态的词汇表。这种方法虽然广泛使用，但也存在局限性。一旦分词完成，模型的处理方式就无法灵活调整，且在面对低资源语言或特殊字符结构的文本时，效果更是不尽如人意。

大语言模型 LLM文本数据处理字节对编码局限性低资源语言处理特殊字符结构分词分词技术优化

- 上云资讯 -

颠覆LLM长文本处理！DeepSeek-OCR发布“视觉记忆压缩”机制，或破解AI记忆瓶颈

京东重磅推出国产芯片驱动的 xLLM 推理引擎

LLM编码幻觉终结者！Exa Code发布，亿级代码索引让AI代理零失误

解锁 LLM Agent 力量！Anthropic 发布工具编写指南，助你玩转大语言模型！

Anthropic 发布 LLM Agent 工具编写指南，助力开发者提升效率

Meta 推出小型推理模型MobileLLM-R1，企业应用向 “小型 AI” 转型

Meta AI 发布 MobileLLM-R1：轻量级边缘推理模型，参数不足 10 亿，性能提升显著

新工具来袭！BentoML发布llm-optimizer，助你轻松优化LLM推理性能

挑战主流认知！蚂蚁、人大在2025外滩大会发布行业首个原生MoE扩散语言模型

重磅！月之暗面开源革命性中间件 “Checkpoint Engine”，为 LLM 推理引擎带来新生机！

Tilde AI 发布开源 TildeOpen LLM：支持多种欧洲语言的超大语言模型

Meta 推出 DeepConf 技术，智能平衡大型语言模型的推理成本与准确性

人工智能能否真正构建软件？Zed 编辑器团队给出了答案！

微软重磅推出POML！全新AI标记语言颠覆提示工程，未来还是XML翻版？

Anthropic 重磅升级！Claude Sonnet 4 模型可支持100万词元

英特尔发布 LLM-Scaler1.0，助力 AI 推理性能提升

腾讯 WeKnora 开源:你的文档管理难题，让 AI 来解决

PyTorch 2.8重磅发布：量化LLM推理性能飞跃，Intel GPU 支持来袭！

开源AI工具DailiCode横空出世:兼容多LLM模型，重构开发者工作流

Meta 推出创新模型 AU-Nets，革新文本处理方式

推荐阅读

上云服务

- 上云资讯 -

颠覆LLM长文本处理！DeepSeek-OCR发布“视觉记忆压缩”机制，或破解AI记忆瓶颈

京东重磅推出国产芯片驱动的 xLLM 推理引擎

LLM编码幻觉终结者！Exa Code发布，亿级代码索引让AI代理零失误

解锁 LLM Agent 力量！Anthropic 发布工具编写指南，助你玩转大语言模型！

Anthropic 发布 LLM Agent 工具编写指南，助力开发者提升效率

​Meta 推出小型推理模型MobileLLM-R1，企业应用向 “小型 AI” 转型

​Meta AI 发布 MobileLLM-R1：轻量级边缘推理模型，参数不足 10 亿，性能提升显著

新工具来袭！BentoML发布llm-optimizer，助你轻松优化LLM推理性能

挑战主流认知！蚂蚁、人大在2025外滩大会发布行业首个原生MoE扩散语言模型

重磅！月之暗面开源革命性中间件 “Checkpoint Engine”，为 LLM 推理引擎带来新生机！

Tilde AI 发布开源 TildeOpen LLM：支持多种欧洲语言的超大语言模型

Meta 推出 DeepConf 技术，智能平衡大型语言模型的推理成本与准确性

人工智能能否真正构建软件？Zed 编辑器团队给出了答案！

微软重磅推出POML！全新AI标记语言颠覆提示工程，未来还是XML翻版？

Anthropic 重磅升级！Claude Sonnet 4 模型可支持100万词元

英特尔发布 LLM-Scaler1.0，助力 AI 推理性能提升

腾讯 WeKnora 开源:你的文档管理难题，让 AI 来解决

PyTorch 2.8重磅发布：量化LLM推理性能飞跃，Intel GPU 支持来袭！

开源AI工具DailiCode横空出世:兼容多LLM模型，重构开发者工作流

Meta 推出创新模型 AU-Nets，革新文本处理方式

推荐阅读

上云服务

Meta 推出小型推理模型MobileLLM-R1，企业应用向 “小型 AI” 转型

Meta AI 发布 MobileLLM-R1：轻量级边缘推理模型，参数不足 10 亿，性能提升显著