- 上云资讯 -
2025-02-19 10:33:31 182人关注
NVIDIA联合高校发布 “FlashInfer”:提升大语言模型推理效率的全新内核库
随着大语言模型(LLM)在现代人工智能应用中的广泛应用,诸如聊天机器人和代码生成器等工具依赖于这些模型的能力。然而,随之而来的推理过程中的效率问题也日益突出。
2025-01-29 09:14:24 3116人关注
DeepSeek R1 你用上了吗?推理效果一骑绝尘,Meta 内部已经慌了!
DeepSeek 近日推出的系列模型在全球 AI 圈引发震动。DeepSeek-V3 以低成本实现高性能,在多项评测中与顶尖闭源模型相当;DeepSeek-R1 则通过创新的训练方式,让模型展现出强大推理能力,性能对标 OpenAI o1 正式版,还开源了模型权重,为 AI 领域带来新的突破和思考。