上云资讯 - 来上云吧，企业上云一站式服务

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-07-11 13:23:12 328人关注

城商行掀起大模型招标潮，百万级投入成行业新风口！

在人工智能技术快速发展的背景下，越来越多的城商行开始纷纷参与到大模型的招标中。根据最新消息，超过10家中小银行近期启动了大模型相关项目的招标，标志着这一领域的竞争加剧。这些银行希望通过大模型技术优化现有的金融服务流程，提高运营效率，进而为客户提供更优质的服务。

城商行大模型招标中小银行大模型应用大模型优化金融服务银行大模型技术竞争金融行业大模型趋势

2025-05-12 10:43:14 255人关注

马斯克透露 Grok 3.5 尚需优化，预计下周发布

近日，埃隆・马斯克在社交平台 X 上回答了一位网友的提问，谈及他最新的人工智能项目 ——Grok3.5。该网友询问了 Grok3.5、GPT-03Pro 以及即将发布的游戏 GTA6哪个会先上线。对此，马斯克坦言:“Grok3.5仍然有些粗糙，预计还需要一周左右的时间进行打磨。”

Musk Grok 3.5 Grok 3.5优化 Grok 3.5发布 AI大模型优化大模型技术更新

2025-01-13 03:19:32 343人关注

大模型瘦身专家！单卡处理Llama 3.1 405B 超强压缩工具LLMC来了

人工智能（AI）正变得越来越聪明，尤其是那些大型语言模型(LLMs)，它们在处理自然语言方面的能力让人惊叹。但你知道吗?这些聪明的AI大脑背后，是需要巨大的计算力和存储空间来支撑的。

Llama 3 大模型压缩工具 405B模型压缩大模型优化技术模型压缩实践

2025-01-06 08:17:41 233人关注

Gemini1.5闪电升级:AI响应速度飙升50%，用户体验大幅提升

Gemini最近推出的更新为其1.5闪存模型带来了显著的性能提升，使响应速度提高了50%。这一改进在网络和移动平台上都清晰可见，尤其让Pro计划用户感受到了明显的速度提升。值得注意的是，这项优化惠及所有用户层级，包括使用该模型的三层用户，堪称一次重大升级。

Gemini 1.5 AI响应速度 AI升级大模型优化 AI性能提升

2024-12-30 09:32:11 179人关注

Anthropic 通过“上下文检索”新方法提高 RAG 准确性

在人工智能领域，如何准确地从知识数据库中获取信息一直是个大难题。近日，人工智能公司 Anthropic 宣布推出了一种名为 “上下文检索” 的新方法，旨在提高知识检索的精确度。该方法通过在检索时添加更多的上下文信息，帮助 AI 系统提供更准确的答案。

Anthropic 上下文检索 RAG 准确性提升大模型优化 AI技术新闻

2024-12-27 08:37:45 235人关注

像人脑一样思考！Meta 新模型Dualformer融合快慢思维，推理能力大幅提升

Meta 的 FAIR 团队最近推出了一款名为 Dualformer 的全新 Transformer 模型，该模型模仿人类的双重认知系统，能够无缝整合快速和慢速推理模式，在推理能力和计算效率上取得了显著突破。

Meta DualFormer 推理能力增强 AI大模型优化模型推理技术 AI技术进展 Meta DualFormer应用场景

2024-12-25 03:24:43 304人关注

Meta AI新量化版本Llama 3.2：速度提高2倍、体量减少56%，手机就能运行

最近，Meta AI 推出了全新的量化 Llama3.2模型，包含1B 和3B 两个版本，这款模型可以在多种设备上进行微调、蒸馏和部署。

Meta AI Llama 3 AI大模型大模型优化技术移动端AI加速模型性能提升

2024-12-23 05:21:44 243人关注

Meta 重磅发布！MobileLLM 模型全面开放，研究人员免费获取！

Meta 近日宣布，其 MobileLLM 模型现已向研究人员开放，用户可在 Hugging Face 平台上免费下载并使用这些模型，这些模型已与 Transformers 库全面集成。

Meta MobileLLM模型发布 MobileLLM模型技术大模型移动端应用 Meta AI模型更新移动端大模型优化

2024-12-22 07:37:42 286人关注

OpenAI 推出 “预测输出” 功能：将 GPT-4o 速度提升约 5 倍

大型语言模型如 GPT-4o 和 GPT-4o-mini 的出现，推动了自然语言处理领域的重大进步。这些模型能够生成高质量的响应，进行文档重写，以及提升各类应用的生产力。然而，这些模型面临的一个主要挑战就是响应生成的延迟。在更新博客或优化代码的过程中，这种延迟可能会严重影响用户体验，尤其是在需要多次迭代的场景下，如文档修改或代码重构，用户往往会感到沮丧。

OpenAI预测输出 GPT-4o速度提升 AI大模型优化预测性输出技术 GPT-4o性能增强

- 上云资讯 -

城商行掀起大模型招标潮，百万级投入成行业新风口！

马斯克透露 Grok 3.5 尚需优化，预计下周发布

大模型瘦身专家！单卡处理Llama 3.1 405B 超强压缩工具LLMC来了

Gemini1.5闪电升级:AI响应速度飙升50%，用户体验大幅提升

Anthropic 通过“上下文检索”新方法提高 RAG 准确性

像人脑一样思考！Meta 新模型Dualformer融合快慢思维，推理能力大幅提升

Meta AI新量化版本Llama 3.2：速度提高2倍、体量减少56%，手机就能运行

Meta 重磅发布！MobileLLM 模型全面开放，研究人员免费获取！

OpenAI 推出 “预测输出” 功能：将 GPT-4o 速度提升约 5 倍

推荐阅读

上云服务

- 上云资讯 -

城商行掀起大模型招标潮，百万级投入成行业新风口！

马斯克透露 Grok 3.5 尚需优化，预计下周发布

大模型瘦身专家！单卡处理Llama 3.1 405B 超强压缩工具LLMC来了

Gemini1.5闪电升级:AI响应速度飙升50%，用户体验大幅提升

Anthropic 通过“上下文检索”新方法 提高 RAG 准确性

像人脑一样思考！Meta 新模型Dualformer融合快慢思维，推理能力大幅提升

Meta AI新量化版本Llama 3.2：速度提高2倍、体量减少56%，手机就能运行

Meta 重磅发布！MobileLLM 模型全面开放，研究人员免费获取！

​OpenAI 推出 “预测输出” 功能：将 GPT-4o 速度提升约 5 倍

推荐阅读

上云服务

Anthropic 通过“上下文检索”新方法提高 RAG 准确性

OpenAI 推出 “预测输出” 功能：将 GPT-4o 速度提升约 5 倍