LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-07-11 13:23:12 102人关注

城商行掀起大模型招标潮,百万级投入成行业新风口!

在人工智能技术快速发展的背景下,越来越多的城商行开始纷纷参与到大模型的招标中。根据最新消息,超过10家中小银行近期启动了大模型相关项目的招标,标志着这一领域的竞争加剧。这些银行希望通过大模型技术优化现有的金融服务流程,提高运营效率,进而为客户提供更优质的服务。

城商行大模型招标 中小银行大模型应用 大模型优化金融服务 银行大模型技术竞争 金融行业大模型趋势

2025-05-12 10:43:14 120人关注

马斯克透露 Grok 3.5 尚需优化,预计下周发布

近日,埃隆・马斯克在社交平台 X 上回答了一位网友的提问,谈及他最新的人工智能项目 ——Grok3.5。该网友询问了 Grok3.5、GPT-03Pro 以及即将发布的游戏 GTA6哪个会先上线。对此,马斯克坦言:“Grok3.5仍然有些粗糙,预计还需要一周左右的时间进行打磨。”

Musk Grok 3.5 Grok 3.5优化 Grok 3.5发布 AI大模型优化 大模型技术更新

2025-01-13 03:19:32 154人关注

大模型瘦身专家!单卡处理Llama 3.1 405B 超强压缩工具LLMC来了

人工智能(AI)正变得越来越聪明,尤其是那些大型语言模型(LLMs),它们在处理自然语言方面的能力让人惊叹。但你知道吗?这些聪明的AI大脑背后,是需要巨大的计算力和存储空间来支撑的。

Llama 3 大模型压缩工具 405B模型压缩 大模型优化技术 模型压缩实践

2025-01-06 08:17:41 70人关注

Gemini1.5闪电升级:AI响应速度飙升50%,用户体验大幅提升

Gemini最近推出的更新为其1.5闪存模型带来了显著的性能提升,使响应速度提高了50%。这一改进在网络和移动平台上都清晰可见,尤其让Pro计划用户感受到了明显的速度提升。值得注意的是,这项优化惠及所有用户层级,包括使用该模型的三层用户,堪称一次重大升级。

Gemini 1.5 AI响应速度 AI升级 大模型优化 AI性能提升

2024-12-30 09:32:11 84人关注

Anthropic 通过“上下文检索”新方法 提高 RAG 准确性

在人工智能领域,如何准确地从知识数据库中获取信息一直是个大难题。近日,人工智能公司 Anthropic 宣布推出了一种名为 “上下文检索” 的新方法,旨在提高知识检索的精确度。该方法通过在检索时添加更多的上下文信息,帮助 AI 系统提供更准确的答案。

Anthropic 上下文检索 RAG 准确性提升 大模型优化 AI技术新闻

2024-12-27 08:37:45 100人关注

像人脑一样思考!Meta 新模型Dualformer融合快慢思维,推理能力大幅提升

Meta 的 FAIR 团队最近推出了一款名为 Dualformer 的全新 Transformer 模型,该模型模仿人类的双重认知系统,能够无缝整合快速和慢速推理模式,在推理能力和计算效率上取得了显著突破。

Meta DualFormer 推理能力增强 AI大模型优化 模型推理技术 AI技术进展 Meta DualFormer应用场景

2024-12-25 03:24:43 93人关注

Meta AI新量化版本Llama 3.2:速度提高2倍、体量减少56%,手机就能运行

最近,Meta AI 推出了全新的量化 Llama3.2模型,包含1B 和3B 两个版本,这款模型可以在多种设备上进行微调、蒸馏和部署。

Meta AI Llama 3 AI大模型 大模型优化技术 移动端AI加速 模型性能提升

2024-12-23 05:21:44 78人关注

Meta 重磅发布!MobileLLM 模型全面开放,研究人员免费获取!

Meta 近日宣布,其 MobileLLM 模型现已向研究人员开放,用户可在 Hugging Face 平台上免费下载并使用这些模型,这些模型已与 Transformers 库全面集成。

Meta MobileLLM模型发布 MobileLLM模型技术 大模型移动端应用 Meta AI模型更新 移动端大模型优化

2024-12-22 07:37:42 148人关注

​OpenAI 推出 “预测输出” 功能:将 GPT-4o 速度提升约 5 倍

大型语言模型如 GPT-4o 和 GPT-4o-mini 的出现,推动了自然语言处理领域的重大进步。这些模型能够生成高质量的响应,进行文档重写,以及提升各类应用的生产力。然而,这些模型面临的一个主要挑战就是响应生成的延迟。在更新博客或优化代码的过程中,这种延迟可能会严重影响用户体验,尤其是在需要多次迭代的场景下,如文档修改或代码重构,用户往往会感到沮丧。

OpenAI预测输出 GPT-4o速度提升 AI大模型优化 预测性输出技术 GPT-4o性能增强

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10