- 上云资讯 -
2025-06-07 12:41:39 12人关注
Claude 3.7正式登陆Trae平台,用户可升级体验更智能AI
2025 年 2 月 27 日,Trae官方推特账号@Trae_ai发布了一则令人振奋的消息:备受期待的Claude 3. 7 现已正式在Trae平台上推出!该消息于太平洋标准时间(PST)上午6: 30 通过推文对外公布,迅速引发了AI爱好者和用户的关注。
2025-06-02 10:20:41 28人关注
Ollama v0.8发布!AI流式响应+实时搜索,本地模型也能秒变智能助手!
Ollama官方宣布推出其最新版本Ollama v0.8,为本地运行大型语言模型(LLM)带来了突破性升级。新版本引入了流式传输响应和工具调用功能,支持实时网络搜索等交互场景,显著提升了本地AI的实用性和灵活性。AIbase为您整理了Ollama v0.8的核心亮点及其对AI生态的影响。
2025-05-09 16:29:14 37人关注
OpenAI 发布关于 AI 模型使用的官方建议,助力用户更高效工作
近日,OpenAI 在其帮助中心发布了针对企业用户的全新指南,详细说明了其多种人工智能模型的最佳使用时机。这一举措旨在帮助用户根据不同的任务需求,选择最合适的 AI 模型,从而提升工作效率和成果质量。
OpenAI AI模型使用技巧 AI模型优化方法 OpenAI模型应用指南 AI模型使用最佳实践 OpenAI技术应用建议
2025-05-03 10:19:39 464人关注
Unsloth发布Qwen3动态量化2.0版本,优化本地运行体验
Unsloth宣布推出Qwen3的动态量化2.0版本(Dynamic2.0Quants),为显存受限的用户提供了高效的本地运行解决方案。据AIbase了解,新版本通过改进的量化技术,在保持高准确度的同时显著降低显存需求,引发社交平台广泛关注。Unsloth还同步发布了详细的本地运行教程,强调温度(Temperature)参数设置的重要性,以避免推理循环问题。相关细节已通过Hugging Face(huggingface.co/unsloth)与Unsloth官网(unsloth.ai)公开。
2025-04-04 12:29:22 82人关注
科大国创星云大模型全面升级,集成适配DeepSeek-R1/V3模型
近日,科大国创在互动平台上宣布,随着人工智能技术的迅猛发展,公司推出的 “星云大模型” 已全面集成适配了 DeepSeek-R1和 V3模型。这一举措标志着科大国创在行业和垂直领域大模型的探索上取得了重要进展,并在多个行业场景中实现了落地应用。
2025-03-21 16:17:17 41人关注
谷歌推出Gemma 3:单GPU上运行的最强AI模型
谷歌近日推出了最新版本的 Gemma AI 模型 ——Gemma3,声称这是 “全球最强的单加速器模型”。与之前发布的 Gemma AI 系列相比,Gemma3在性能上有了显著提升,尤其适合只配备一张 Nvidia H100显卡的开发者。该模型的设计初衷是为了帮助开发者创建能够在各种设备上运行的 AI 应用,从智能手机到工作站均可兼容。
2025-03-03 10:29:21 68人关注
DeepSeek开源周第六天:极致推理优化系统,提高GPU计算效率
在人工智能(AI)技术快速发展的今天,DeepSeek 团队推出了其全新的 DeepSeek-V3/R1推理系统。这一系统旨在通过更高的吞吐量和更低的延迟,推动 AGI(通用人工智能)的高效发展。为了实现这一目标,DeepSeek 采用了跨节点专家并行(Expert Parallelism,EP)技术,显著提高了 GPU 的计算效率,并在降低延迟的同时,扩展了批处理规模。
2025-02-07 16:21:18 131人关注
OpenAI更新o3-mini模型,展示了给出答案的 “思维链”
近日,OpenAI 在推出其旗舰 AI 模型 o3和 o3-mini 后,进行了重大更新,改变了 o3-mini 的回应方式。现在,这款模型不仅能够回答用户的问题,还能展示其思考过程,为用户提供更多透明度。这一变化标志着 OpenAI 在提升用户体验方面迈出了重要一步,使得 AI 工具的使用变得更加人性化。
OpenAI O3 Mini模型 Thought Chain技术 OpenAI模型更新 AI模型优化 OpenAI新闻动态
2025-01-28 07:21:34 94人关注
Google AI 提出了扩散模型中推理时间缩放的基本框架
来自纽约大学、麻省理工学院和谷歌的研究团队近日提出了一个创新框架,旨在解决扩散模型在推理时间扩展方面的瓶颈问题。这一突破性研究超越了传统简单增加去噪步骤的方法,为提升生成模型性能开辟了新途径。
2025-01-23 13:23:33 50人关注
苹果与NVIDIA联手提升AI模型生产效率,速度提升近三倍
近日,苹果公司在机器学习领域的最新研究显示,他们通过与 NVIDIA 的合作,成功将大型语言模型(LLM)的生成速度提高了近三倍。这一进展的关键在于苹果开源的技术 “Recurrent Drafter”(ReDrafter),它采用了一种推测解码方法,能够显著提升模型训练的效率。