- 上云资讯 -
2025-10-21 16:15:38 115人关注
Andrej Karpathy评DeepSeek-OCR论文:图像输入可能成为大语言模型新方向
特斯拉前自动驾驶负责人、OpenAI联合创始人Andrej Karpathy近日在推特上评论了开源的DeepSeek-OCR论文,提出了一个颇具启发性的观点:相比传统文本输入,图像作为大语言模型(LLM)的输入形式可能更加高效。这一观点在AI研究社区引发了关于模型输入方式未来演进方向的讨论。
2025-10-12 09:42:21 36人关注
AI安全警报:只需250份文件即可 “投毒” 大语言模型
近日,人工智能研究公司 Anthropic 发布了一项震惊业界的研究,揭示了对大语言模型进行 “数据投毒” 攻击的新可能性。以往,大家普遍认为,攻击者需要占训练数据中一定比例的 “毒药” 样本才能成功,但该研究颠覆了这一观念。实际上,只需 250 份 “投毒” 文档就足以对任何规模的大模型实施攻击。
2025-09-20 18:14:29 78人关注
解锁 LLM Agent 力量!Anthropic 发布工具编写指南,助你玩转大语言模型!
近日,人工智能公司 Anthropic 在其官方博客上发布了一份重磅指南《Writing effective tools for LLM agents—using LLM agents》。这份指南详细阐述了如何利用 Model Context Protocol(MCP)为大语言模型(LLM)代理(Agent)设计高效工具,提供了一个系统化的 “原型 - 评估 - 协作” 三步迭代流程,旨在帮助开发者更好地构建和优化工具。
2025-09-11 18:34:14 263人关注
腾讯开源图检索增强生成框架Youtu-GraphRAG
9月11日,腾讯优图实验室开源了Youtu-GraphRAG,这是一个全新的图检索增强生成框架,旨在通过大语言模型+RAG模式,将知识组织成图谱,再交给大语言模型进行检索和推理,从而提高模型在处理复杂问答任务时的准确性和可追溯性。Youtu-GraphRAG特别适用于企业知识库问答、科研文档解析、个人知识管理等知识密集型场景。
腾讯优图实验室 Youtu-GraphRAG开源 图检索增强生成框架 大语言模型+RAG模式 知识图谱组织 企业知识库问答 科研文档解析 个人知识管理
2025-09-05 13:13:19 414人关注
瑞士重磅发布自主开源AI大模型Apertus
在全球人工智能技术蓬勃发展的背景下,瑞士于近日正式推出了其首个完全开源的大语言模型 ——Apertus。这一模型由瑞士联邦理工学院(EPFL)、苏黎世联邦理工学院(ETH Zurich)以及国家超级计算中心(CSCS)共同研发,标志着瑞士在人工智能领域的自主创新迈出了重要一步。
瑞士Apertus大语言模型 开源AI模型 瑞士人工智能创新 EPFL人工智能研究 ETH Zurich语言模型 CSCS超级计算 瑞士自主AI技术
2025-09-04 13:22:41 229人关注
Meta 推出 DeepConf 技术,智能平衡大型语言模型的推理成本与准确性
近日,Meta AI 联合加州大学圣地亚哥分校(UCSD)推出了一种名为 Deep Think with Confidence(DeepConf) 的新技术,旨在帮助企业在大语言模型(LLM)的复杂推理任务中,有效降低算力成本的同时保持高准确率 。
大语言模型推理优化 DeepConf 技术解析 LLM 算力成本降低 复杂推理任务效率提升 Meta AI 与 UCSD 合作研究 企业级 AI 应用优化
2025-09-02 15:39:32 396人关注
开源多模态模型MiniCPM-V 4.5发布,8亿参数实现移动端AI部署
近日,开源AI社区迎来重要进展,面向端侧设备的多模态大语言模型MiniCPM-V4.5正式发布。这款模型以8亿参数规模实现了在智能手机和平板电脑上的高效运行,为移动端AI应用开拓了新的可能性。
2025-09-01 13:28:17 160人关注
腾讯ARC开源音频模型 AudioStory:用大语言模型生成长音频
近日,腾讯 ARC 团队发布了一款名为 AudioStory 的模型,旨在利用大语言模型(LLMs)生成长篇叙事音频。该模型解决了现有文本到音频生成技术在处理短音频方面的优势与长篇叙事音频在时间连贯性与组合推理上的挑战。
腾讯ARC团队AudioStory模型 大语言模型生成长篇音频 文本到音频生成技术 长篇叙事音频时间连贯性 音频生成组合推理挑战
2025-09-01 12:23:20 322人关注
美团推出开源大模型LongCat:旨在赋能开发者,加速AI应用落地
近日,美团正式发布其最新的开源大语言模型 LongCat(龙猫),旨在推动人工智能技术的发展和应用。该模型的发布不仅标志着美团在AI领域的又一重要进展,也为开发者和研究人员提供了一个功能强大的新工具。
2025-08-20 17:45:22 71人关注
快手 Klear-Reasoner 模型成功登顶,数学推理准确率超 90%
在大语言模型的竞争中,数学和代码推理能力已成为一项重要的评估标准。快手最近发布的 Klear-Reasoner 模型基于 Qwen3-8B-Base 打造,其在多个权威基准测试中表现出色,数学推理的准确率甚至突破了90%,成为同规模模型中的佼佼者。
Klear-Reasoner 大语言模型数学推理 代码推理能力评估 Qwen3-8B-Base 模型 权威基准测试表现 同规模模型性能对比
2025-08-09 12:10:29 82人关注
OpenAI GPT-5正式登陆Cline,展现先进AI能力
据AIbase报道,OpenAI最新款GPT-5模型已正式在Cline平台上线,被誉为OpenAI迄今最先进的大语言模型。GPT-5在推理能力、代码质量和用户体验方面显著提升,成为开发者、企业和研究人员的强大工具。
GPT-5模型 OpenAI最新大语言模型 GPT-5推理能力 GPT-5代码质量 GPT-5用户体验 Cline平台AI工具
2025-08-09 10:29:23 137人关注
PyTorch 2.8重磅发布:量化LLM推理性能飞跃,Intel GPU 支持来袭!
近日,开源机器学习框架 PyTorch 迎来了全新版本2.8的正式发布。这一版本的发布备受关注,主要集中在提升量化大语言模型(LLM)的推理性能,尤其是在 Intel CPU 上的表现。此次更新不仅显著增强了在离线模式下的推理效率,还首次实验性支持了 Intel GPU 的分布式后端。
PyTorch 2.8 新特性 量化大语言模型推理性能提升 Intel CPU 推理优化 离线模式推理效率 Intel GPU 分布式后端支持 PyTorch 量化 LLM 优化
2025-08-07 18:35:18 175人关注
小红书发布开源多模态大模型 dots.vlm1,以 NaViT 视觉编码器领跑行业
小红书 Hi Lab 近日发布并开源了其首个自研多模态大模型 dots.vlm1。该模型基于12亿参数的 NaViT 视觉编码器 和 DeepSeek V3大语言模型,从零开始完全训练,其卓越性能在多模态视觉理解与推理能力上已接近当前领先的闭源模型,如 Gemini2.5Pro 和 Seed-VL1.5,标志着开源多模态模型的性能达到了新的高度。
小红书多模态大模型 dots.vlm1开源模型 NaViT视觉编码器 DeepSeek V3大语言模型 多模态视觉理解与推理 开源多模态模型性能
