- 上云资讯 -
2025-04-21 10:19:18 160人关注
字节跳动研究开源 ChatTS-14B:原生理解并随着时间的推移进行推理
字节跳动研究团队宣布开源 ChatTS-14B,这是一款专为时间序列数据理解和推理设计的140亿参数大型语言模型(LLM)。以 Apache2.0许可协议发布,ChatTS-14B 的开源引发了 AI 社区的广泛关注,被认为是时间序列分析与生成式 AI 结合的重大进展。
2025-03-21 10:37:26 82人关注
硅基流动宣布DeepSeek-R1&V3 API支持批量推理 价格暴降75%
硅基流动 SiliconCloud 平台即日起正式推出 DeepSeek-R1& V3API 的批量推理(Batch Inference)功能。用户现在可以通过批量 API 向 SiliconCloud 发送请求,摆脱实时推理速率的限制,并在预期24小时内完成大规模数据处理任务。
DeepSeek R1 V3 API 批量推理 API价格下调 DeepSeek R1 V3价格优化 大模型推理成本降低
2025-03-13 18:14:31 277人关注
DeepSeek-R1 模型幻觉问题严重,推理能力与准确性面临挑战
近日,Vectara 的机器学习团队对 DeepSeek 系列的两款模型进行了深入的幻觉测试,结果显示,DeepSeek-R1的幻觉率高达14.3%,显著高于其前身 DeepSeek-V3的3.9%。这表明,在增强推理的过程中,DeepSeek-R1产生了更多不准确或与原始信息不一致的内容。该结果引发了对推理增强大语言模型(LLM)产生幻觉率的广泛讨论。
2025-02-25 10:37:39 100人关注
新型语言模型 Huginn:突破推理界限 无需语言即可“思考”
近日,来自图宾根埃利斯研究所、马里兰大学和劳伦斯利弗莫尔国家实验室的研究团队,开发出名为 Huginn 的新型语言模型,该模型采用递归架构,显著提升了推理能力。与传统模型不同,Huginn 无需专门的“推理链”训练,便可在神经网络的“潜在空间”内自主推理,再输出结果。
2025-02-19 10:33:31 182人关注
NVIDIA联合高校发布 “FlashInfer”:提升大语言模型推理效率的全新内核库
随着大语言模型(LLM)在现代人工智能应用中的广泛应用,诸如聊天机器人和代码生成器等工具依赖于这些模型的能力。然而,随之而来的推理过程中的效率问题也日益突出。
2025-01-29 09:14:24 3115人关注
DeepSeek R1 你用上了吗?推理效果一骑绝尘,Meta 内部已经慌了!
DeepSeek 近日推出的系列模型在全球 AI 圈引发震动。DeepSeek-V3 以低成本实现高性能,在多项评测中与顶尖闭源模型相当;DeepSeek-R1 则通过创新的训练方式,让模型展现出强大推理能力,性能对标 OpenAI o1 正式版,还开源了模型权重,为 AI 领域带来新的突破和思考。
2025-01-28 10:37:18 295人关注
DeepSeek推出全新推理模型 DeepSeek-R1 性能比肩OpenAI-o1
2025年1月20日,DeepSeek 宣布推出其首个通过强化学习 (RL) 训练的推理模型 DeepSeek-R1,该模型在多个推理基准测试中取得了与 OpenAI-o1-1217相当的性能。 DeepSeek-R1基于 DeepSeek-V3-Base 模型,并采用了多阶段训练和冷启动数据来提高推理能力。
DeepSeek R1 DeepSeek 推理模型 OpenAI O1 大模型推理技术 DeepSeek 新模型发布 AI 推理模型对比
2024-12-28 23:27:40 116人关注
苹果AI研究团队发现大模型推理短板 一句话就把OpenAI o1干废了
在人工智能的世界里,机器学习模型尤其是大型语言模型(LLMs)的推理能力一直是科学家们关注的焦点。
2024-12-28 15:40:11 75人关注
创新开源框架OpenR 有效提升大模型推理能力
一个名为OpenR的创新开源框架近日问世,旨在解决大型语言模型(LLMs)在复杂推理任务中的短板。这一由伦敦大学学院、利物浦大学、上海交通大学、香港科技大学(广州)和西湖大学研究人员联合开发的框架,通过结合测试时计算、强化学习和过程监督,为提升LLMs的推理能力开辟了新途径。
2024-12-23 10:22:32 35人关注
OpenAI发布o3:AI 推理能力的重大突破,得分高达 87.5%
OpenAI 正式发布了其最新的 o-Model 推理系列模型 ——OpenAI o3。作为继任者,o3在数学和科学推理方面展现了显著的进步,引发了业界对其能力与局限性的广泛讨论。
2024-12-15 09:30:29 77人关注
Kimi联手清华开源大模型推理架构Mooncake 提升AI推理效率
在人工智能迅速发展的时代,大型模型的智能化水平不断提升,但随之而来的推理系统效率挑战也越来越明显。如何应对高推理负载、降低推理成本、缩短响应时间,已成为业界共同面对的重要问题。