- 上云资讯 -
2025-06-18 13:23:13 71人关注
大模型推理大变革!CMU 与英伟达携手推出 Multiverse,实现超高速并行生成
随着人工智能的发展,大型语言模型(LLM)的应用越来越广泛,但目前的推理方式仍然存在不少局限性。传统的自回归生成方式需要逐个生成 token,效率较低且无法充分利用现代硬件的并行计算能力。为了解决这一问题,卡耐基梅隆大学(CMU)与英伟达的研究团队推出了一种名为 Multiverse 的新型生成模型,旨在实现原生并行生成,从根本上改变我们对 LLM 推理的理解。
2025-04-21 10:19:18 243人关注
字节跳动研究开源 ChatTS-14B:原生理解并随着时间的推移进行推理
字节跳动研究团队宣布开源 ChatTS-14B,这是一款专为时间序列数据理解和推理设计的140亿参数大型语言模型(LLM)。以 Apache2.0许可协议发布,ChatTS-14B 的开源引发了 AI 社区的广泛关注,被认为是时间序列分析与生成式 AI 结合的重大进展。
2025-03-21 10:37:26 156人关注
硅基流动宣布DeepSeek-R1&V3 API支持批量推理 价格暴降75%
硅基流动 SiliconCloud 平台即日起正式推出 DeepSeek-R1& V3API 的批量推理(Batch Inference)功能。用户现在可以通过批量 API 向 SiliconCloud 发送请求,摆脱实时推理速率的限制,并在预期24小时内完成大规模数据处理任务。
DeepSeek R1 V3 API 批量推理 API价格下调 DeepSeek R1 V3价格优化 大模型推理成本降低
2025-03-13 18:14:31 417人关注
DeepSeek-R1 模型幻觉问题严重,推理能力与准确性面临挑战
近日,Vectara 的机器学习团队对 DeepSeek 系列的两款模型进行了深入的幻觉测试,结果显示,DeepSeek-R1的幻觉率高达14.3%,显著高于其前身 DeepSeek-V3的3.9%。这表明,在增强推理的过程中,DeepSeek-R1产生了更多不准确或与原始信息不一致的内容。该结果引发了对推理增强大语言模型(LLM)产生幻觉率的广泛讨论。
2025-02-25 10:37:39 161人关注
新型语言模型 Huginn:突破推理界限 无需语言即可“思考”
近日,来自图宾根埃利斯研究所、马里兰大学和劳伦斯利弗莫尔国家实验室的研究团队,开发出名为 Huginn 的新型语言模型,该模型采用递归架构,显著提升了推理能力。与传统模型不同,Huginn 无需专门的“推理链”训练,便可在神经网络的“潜在空间”内自主推理,再输出结果。
2025-02-19 10:33:31 371人关注
NVIDIA联合高校发布 “FlashInfer”:提升大语言模型推理效率的全新内核库
随着大语言模型(LLM)在现代人工智能应用中的广泛应用,诸如聊天机器人和代码生成器等工具依赖于这些模型的能力。然而,随之而来的推理过程中的效率问题也日益突出。
2025-01-29 09:14:24 3244人关注
DeepSeek R1 你用上了吗?推理效果一骑绝尘,Meta 内部已经慌了!
DeepSeek 近日推出的系列模型在全球 AI 圈引发震动。DeepSeek-V3 以低成本实现高性能,在多项评测中与顶尖闭源模型相当;DeepSeek-R1 则通过创新的训练方式,让模型展现出强大推理能力,性能对标 OpenAI o1 正式版,还开源了模型权重,为 AI 领域带来新的突破和思考。
2025-01-28 10:37:18 347人关注
DeepSeek推出全新推理模型 DeepSeek-R1 性能比肩OpenAI-o1
2025年1月20日,DeepSeek 宣布推出其首个通过强化学习 (RL) 训练的推理模型 DeepSeek-R1,该模型在多个推理基准测试中取得了与 OpenAI-o1-1217相当的性能。 DeepSeek-R1基于 DeepSeek-V3-Base 模型,并采用了多阶段训练和冷启动数据来提高推理能力。
DeepSeek R1 DeepSeek 推理模型 OpenAI O1 大模型推理技术 DeepSeek 新模型发布 AI 推理模型对比
2025-01-15 17:21:37 197人关注
苹果研究团队出品!LazyLLM:提高LLM长文本推理效率
最近苹果公司的研究团队和 Meta AI 的研究人员联合推出了一项名为 LazyLLM 的新技术,这项技术在提高大型语言模型(LLM)在长文本推理中的效率。