LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云 火山引擎 通义大模型 DeepSeek AI 大模型 人工智能 MCP 智能体

2025-06-04 10:23:39 863人关注

DeepSeek R1-0528震撼发布:免费128K上下文,性能直逼OpenAI o3!

作为AI领域的先锋力量,DeepSeek再次以其技术突破引发行业热议。2025年5月28日,DeepSeek悄然发布了R1-0528版本,这一更新不仅在性能上实现大幅跃升,还以免费开放的姿态震撼市场。本文由AIbase编辑部整理最新信息,带您深入了解这一版本的亮点与潜力。

DeepSeek R1 128k上下文 免费大模型 DeepSeek新闻 大模型技术更新

2025-04-05 14:39:28 71人关注

研究警告AI语言模型极限:超8K上下文性能腰斩,概念推理成难关

慕尼黑大学、慕尼黑机器学习中心与Adobe Research近日联合发布的研究显示,包括GPT-4o、Gemini1.5Pro和Llama-3.3-70B在内的12款顶尖AI语言模型,在长文本概念推理任务中面临显著性能衰减。尽管这些模型均支持至少128,000个标记的上下文处理,但其深层逻辑关联能力仍存在根本性局限。

AI语言模型 上下文性能 概念推理 AI模型性能优化 语言模型技术原理

2025-01-11 14:40:30 140人关注

开源角色扮演模型Peach-9B-8k-Roleplay 情感表达更丰富

Peach-9B-8k-Roleplay是一款专门为角色扮演任务设计的AI模型,基于强大的01-ai/Yi-1.5-9B模型微调而成,拥有100,000多次对话合成的经验积累。

peach-9b 8k上下文 角色扮演模型 情感丰富AI 大语言模型应用

2024-12-19 10:34:10 74人关注

超越Gemma2!​IBM发布Granite3.1模型:支持128K上下文长度

IBM 正式发布了其新一代开源大语言模型 Granite3.1,力图在企业级 AI 领域占据领先地位。这一系列模型具备128K 的扩展上下文长度、嵌入模型、内置的幻觉检测功能以及性能的显著提升。

IBM Granite31 128k上下文窗口 大模型上下文扩展 IBM大模型技术 长文本处理技术

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10