- 上云资讯 -
2025-08-19 11:17:38 55人关注
理想汽车MindGPT 3.1发布:速度跃升近5倍
理想汽车正式宣布其自研的MindGPT大模型迎来重大升级,全新版本MindGPT3.1惊艳亮相。此次升级将智能体能力深度融入大模型之中,实现了边想边搜的创新功能,即在推理过程中能够同步调用各类工具,从而为用户提供更加迅速、全面且精准的结果反馈。
理想汽车MindGPT3.1 自研大模型升级 智能体能力融入大模型 边想边搜功能 大模型推理工具调用 AI大模型精准反馈
2025-08-08 09:17:14 59人关注
消息称百度 8 月底前将发布新AI推理模型 文心5.0未来数月推出
据报道,百度正在加速推进其文心大模型的更新计划。消息人士透露,百度最快将于8月底推出文心大模型的最新版推理模型,目前该模型正处于紧张的测试阶段。这一新版本在逻辑推理和复杂计算等关键能力上有望超越OpenAI的o3满血版。
百度文心大模型 文心大模型更新计划 文心大模型推理模型 文心大模型逻辑推理能力 文心大模型复杂计算能力 文心大模型与OpenAI对比
2025-08-05 13:40:23 64人关注
阿里巴巴与南开大学携手推出视频大模型新型压缩技术LLaVA-Scissor
近日,阿里巴巴通义实验室与南开大学计算机科学学院联合发布了一种创新的视频大模型压缩方法 ——LLaVA-Scissor。这一技术的出现旨在应对视频模型处理中的一系列挑战,特别是传统方法在处理视频帧时所面临的高 token 数量带来的推理速度和扩展性问题。
2025-08-04 16:13:27 138人关注
昆仑万维发布并开源全新推理大模型 MindLink
昆仑万维正式发布并开源了其最新推理大模型Skywork MindLink,同时公布了72B模型权重、技术报告及代码仓库链接,引发行业广泛关注。
2025-06-18 13:23:13 96人关注
大模型推理大变革!CMU 与英伟达携手推出 Multiverse,实现超高速并行生成
随着人工智能的发展,大型语言模型(LLM)的应用越来越广泛,但目前的推理方式仍然存在不少局限性。传统的自回归生成方式需要逐个生成 token,效率较低且无法充分利用现代硬件的并行计算能力。为了解决这一问题,卡耐基梅隆大学(CMU)与英伟达的研究团队推出了一种名为 Multiverse 的新型生成模型,旨在实现原生并行生成,从根本上改变我们对 LLM 推理的理解。
2025-04-21 10:19:18 302人关注
字节跳动研究开源 ChatTS-14B:原生理解并随着时间的推移进行推理
字节跳动研究团队宣布开源 ChatTS-14B,这是一款专为时间序列数据理解和推理设计的140亿参数大型语言模型(LLM)。以 Apache2.0许可协议发布,ChatTS-14B 的开源引发了 AI 社区的广泛关注,被认为是时间序列分析与生成式 AI 结合的重大进展。
2025-03-21 10:37:26 215人关注
硅基流动宣布DeepSeek-R1&V3 API支持批量推理 价格暴降75%
硅基流动 SiliconCloud 平台即日起正式推出 DeepSeek-R1& V3API 的批量推理(Batch Inference)功能。用户现在可以通过批量 API 向 SiliconCloud 发送请求,摆脱实时推理速率的限制,并在预期24小时内完成大规模数据处理任务。
DeepSeek R1 V3 API 批量推理 API价格下调 DeepSeek R1 V3价格优化 大模型推理成本降低
2025-03-13 18:14:31 538人关注
DeepSeek-R1 模型幻觉问题严重,推理能力与准确性面临挑战
近日,Vectara 的机器学习团队对 DeepSeek 系列的两款模型进行了深入的幻觉测试,结果显示,DeepSeek-R1的幻觉率高达14.3%,显著高于其前身 DeepSeek-V3的3.9%。这表明,在增强推理的过程中,DeepSeek-R1产生了更多不准确或与原始信息不一致的内容。该结果引发了对推理增强大语言模型(LLM)产生幻觉率的广泛讨论。