上云资讯 - 来上云吧，企业上云一站式服务

2025-06-07 12:41:39 310人关注

Claude 3.7正式登陆Trae平台，用户可升级体验更智能AI

2025 年 2 月 27 日，Trae官方推特账号@Trae_ai发布了一则令人振奋的消息：备受期待的Claude 3. 7 现已正式在Trae平台上推出！该消息于太平洋标准时间（PST）上午6: 30 通过推文对外公布，迅速引发了AI爱好者和用户的关注。

Claude 3.7 AI平台升级智能AI技术 Claude新功能 AI模型优化

2025-06-02 10:20:41 422人关注

Ollama v0.8发布！AI流式响应+实时搜索，本地模型也能秒变智能助手！

Ollama官方宣布推出其最新版本Ollama v0.8，为本地运行大型语言模型（LLM）带来了突破性升级。新版本引入了流式传输响应和工具调用功能，支持实时网络搜索等交互场景，显著提升了本地AI的实用性和灵活性。AIbase为您整理了Ollama v0.8的核心亮点及其对AI生态的影响。

Ollama v0.8 AI streaming 本地模型运行 AI模型部署本地AI模型优化

2025-05-09 16:29:14 349人关注

OpenAI 发布关于 AI 模型使用的官方建议，助力用户更高效工作

近日，OpenAI 在其帮助中心发布了针对企业用户的全新指南，详细说明了其多种人工智能模型的最佳使用时机。这一举措旨在帮助用户根据不同的任务需求，选择最合适的 AI 模型，从而提升工作效率和成果质量。

OpenAI AI模型使用技巧 AI模型优化方法 OpenAI模型应用指南 AI模型使用最佳实践 OpenAI技术应用建议

2025-05-03 10:19:39 2499人关注

Unsloth发布Qwen3动态量化2.0版本，优化本地运行体验

Unsloth宣布推出Qwen3的动态量化2.0版本（Dynamic2.0Quants），为显存受限的用户提供了高效的本地运行解决方案。据AIbase了解，新版本通过改进的量化技术，在保持高准确度的同时显著降低显存需求，引发社交平台广泛关注。Unsloth还同步发布了详细的本地运行教程，强调温度(Temperature)参数设置的重要性，以避免推理循环问题。相关细节已通过Hugging Face(huggingface.co/unsloth)与Unsloth官网(unsloth.ai)公开。

Unsloth Qwen3 动态量化 AI模型优化大模型量化技术

2025-04-05 16:38:38 392人关注

DeepSeek 与清华联合研究:创新奖励模型推理方法，提升可扩展性

近日，DeepSeek 和清华的研究者发布新论文，探讨了奖励模型的推理时 Scaling 方法，让 DeepSeek R2似乎更近一步。目前，强化学习在大语言模型的大规模后训练阶段广泛应用，但面临为大语言模型获取准确奖励信号的挑战。

深度求索清华创新奖励模型模型可扩展性奖励模型研究 AI模型优化

2025-04-04 12:29:22 468人关注

科大国创星云大模型全面升级，集成适配DeepSeek-R1/V3模型

近日，科大国创在互动平台上宣布，随着人工智能技术的迅猛发展，公司推出的 “星云大模型” 已全面集成适配了 DeepSeek-R1和 V3模型。这一举措标志着科大国创在行业和垂直领域大模型的探索上取得了重要进展，并在多个行业场景中实现了落地应用。

KD星云模型升级 DeepSeek R1 V3 大模型升级 AI模型优化 DeepSeek R1版本更新

2025-03-21 16:17:17 272人关注

谷歌推出Gemma 3：单GPU上运行的最强AI模型

谷歌近日推出了最新版本的 Gemma AI 模型 ——Gemma3，声称这是 “全球最强的单加速器模型”。与之前发布的 Gemma AI 系列相比，Gemma3在性能上有了显著提升，尤其适合只配备一张 Nvidia H100显卡的开发者。该模型的设计初衷是为了帮助开发者创建能够在各种设备上运行的 AI 应用，从智能手机到工作站均可兼容。

Google Gemma 3 单GPU运行AI AI模型优化轻量级AI模型 Google Gemma 3性能

2025-03-03 10:29:21 455人关注

DeepSeek开源周第六天：极致推理优化系统，提高GPU计算效率

在人工智能（AI）技术快速发展的今天，DeepSeek 团队推出了其全新的 DeepSeek-V3/R1推理系统。这一系统旨在通过更高的吞吐量和更低的延迟，推动 AGI(通用人工智能)的高效发展。为了实现这一目标，DeepSeek 采用了跨节点专家并行(Expert Parallelism，EP)技术，显著提高了 GPU 的计算效率，并在降低延迟的同时，扩展了批处理规模。

DeepSeek开源周报 GPU计算优化 DeepSeek技术更新开源AI模型优化高性能计算优化

2025-02-09 10:25:45 335人关注

腾讯发布大语言模型训练新专利，提升模型泛化与准确性

近日，腾讯科技（深圳）有限公司在天眼查 App 上公布了一项关于大语言模型的训练方法及相关设备的专利。这项专利的名称为 “大语言模型的训练方法、装置、计算机设备及存储介质”，旨在通过创新的训练方式，提升大语言模型的学习能力和准确性。

腾讯新专利语言模型训练训练精度提升大模型技术专利技术解析 AI模型优化

2025-02-07 16:21:18 374人关注

OpenAI更新o3-mini模型，展示了给出答案的 “思维链”

近日，OpenAI 在推出其旗舰 AI 模型 o3和 o3-mini 后，进行了重大更新，改变了 o3-mini 的回应方式。现在，这款模型不仅能够回答用户的问题，还能展示其思考过程，为用户提供更多透明度。这一变化标志着 OpenAI 在提升用户体验方面迈出了重要一步，使得 AI 工具的使用变得更加人性化。

OpenAI O3 Mini模型 Thought Chain技术 OpenAI模型更新 AI模型优化 OpenAI新闻动态

2025-01-28 07:21:34 317人关注

Google AI 提出了扩散模型中推理时间缩放的基本框架

来自纽约大学、麻省理工学院和谷歌的研究团队近日提出了一个创新框架，旨在解决扩散模型在推理时间扩展方面的瓶颈问题。这一突破性研究超越了传统简单增加去噪步骤的方法，为提升生成模型性能开辟了新途径。

Google AI Diffusion模型模型推理推理加速 AI模型优化 Google AI技术应用

2025-01-23 13:23:33 255人关注

苹果与NVIDIA联手提升AI模型生产效率，速度提升近三倍

近日，苹果公司在机器学习领域的最新研究显示，他们通过与 NVIDIA 的合作，成功将大型语言模型（LLM）的生成速度提高了近三倍。这一进展的关键在于苹果开源的技术 “Recurrent Drafter”(ReDrafter)，它采用了一种推测解码方法，能够显著提升模型训练的效率。

AI模型效率提升 Apple与NVIDIA合作 AI模型优化技术 AI硬件加速 AI模型性能提升

2025-01-19 09:35:28 225人关注

GroqCloud 静悄悄推出 Whisper V3 Large，开发者们快来体验吧！

近日，GroqCloud 静悄悄地推出了 Whisper V3 Large。赶紧尝试吧，现在已经内置在 GroqChat 中，让每个人都能体验。

GroqCloud Whisper V3 Large AI大模型语音识别技术云端AI服务 AI模型优化

2025-01-16 21:35:44 318人关注

AI大模型数字比较出错引发讨论月之暗面回应9.11大于9.9:有助了解能力边界

近日，多家人工智能大模型在进行简单数字比较时出现错误引发广泛关注。包括字节豆包、GPT4o、月之暗面Kimi、阶跃星辰跃问、百川智能百小应等在内的多个知名AI模型，在回答"9.11和9.9哪个更大"这样的基础问题时均给出了错误答案。此外，此前有用户发现多个大模型在回答"strawberry"一词中有几个"r"时也出现了错误。

AI模型比较 AI错误响应 AI模型错误分析 AI模型性能评估 AI模型优化技巧

2025-01-16 13:29:21 443人关注

Groq开源的Llama AI模型登顶排行榜，函数调用方面优于GPT-4o和Claude

人工智能硬件初创公司Groq发布了两款开源语言模型，这两款模型在专门工具使用能力方面胜过科技巨头。新的 Llama-3-Groq-70B-Tool-Use 模型已经在伯克利函数调用排行榜（BFCL）上夺得榜首，超越了来自 OpenAI、谷歌和 Anthropic 等公司的专有产品。

Groq Llama AI模型 AI模型排行榜 AI性能评测 AI模型优化

2025-01-09 19:15:37 407人关注

半真半幻！基于Flux.1 的LoRA模型Half_illustration 让照片秒变艺术大片

Half_illustration!这个基于Flux.1的LoRA模型简直就是照片界的魔术师，轻轻一挥魔杖，就能让你的照片华丽变身，成为令人惊叹的艺术创作。

Flux-1 LORA半精度 AI模型优化模型训练技巧低资源训练方法

2025-01-09 01:25:19 1643人关注

字节豆包语音模型和视觉模型再升级综合能力提升20.3%

在2024年8月21日举办的火山引擎AI创新巡展上海站上，火山引擎展示了其豆包大模型的全面升级，以及对话式AI实时交互解决方案的增强。

字节跳动豆包大模型语音视觉模型升级大模型技术更新 AI模型优化

2025-01-05 18:30:35 501人关注

腾讯发布“混元Turbo”模型：推理成本降低50% 效率提升100%

在2024年腾讯全球数字生态大会上，腾讯公司副总裁兼云业务总裁邱跃鹏对外宣布——腾讯混元Turbo大模型的正式亮相。

腾讯混元大模型大模型推理成本优化混元Turbo模型腾讯AI模型优化大模型成本降低方案

2025-01-03 23:18:35 292人关注

告别幻觉！谷歌推新模型DataGemma，统计数据准确率暴涨58%

近日，谷歌宣布推出新的开源 AI 模型 DataGemma，旨在解决大语言模型（LLM）在处理统计数据时常出现的 “幻觉” 问题。

幻觉消除技术 Google Datagemma模型大模型幻觉问题 AI模型优化 Google AI技术进展

2024-12-31 20:28:14 297人关注

OpenAI 新模型 o1 声称能 “完美” 纠正偏见，但数据并不完全支持

近日，OpenAI 的全球事务副总裁安娜・马坎朱（Anna Makanju）在联合国 “未来峰会” 上发表了一番关于人工智能偏见的看法。

OpenAI模型O1 AI模型偏差校正 AI模型优化技术 OpenAI最新研究成果 AI模型偏差修正方法

- 上云资讯 -

Claude 3.7正式登陆Trae平台，用户可升级体验更智能AI

Ollama v0.8发布！AI流式响应+实时搜索，本地模型也能秒变智能助手！

OpenAI 发布关于 AI 模型使用的官方建议，助力用户更高效工作

Unsloth发布Qwen3动态量化2.0版本，优化本地运行体验

DeepSeek 与清华联合研究:创新奖励模型推理方法，提升可扩展性

科大国创星云大模型全面升级，集成适配DeepSeek-R1/V3模型

谷歌推出Gemma 3：单GPU上运行的最强AI模型

DeepSeek开源周第六天：极致推理优化系统，提高GPU计算效率

腾讯发布大语言模型训练新专利，提升模型泛化与准确性

OpenAI更新o3-mini模型，展示了给出答案的 “思维链”

Google AI 提出了扩散模型中推理时间缩放的基本框架

苹果与NVIDIA联手提升AI模型生产效率，速度提升近三倍

GroqCloud 静悄悄推出 Whisper V3 Large，开发者们快来体验吧！

AI大模型数字比较出错引发讨论月之暗面回应9.11大于9.9:有助了解能力边界

Groq开源的Llama AI模型登顶排行榜，函数调用方面优于GPT-4o和Claude

半真半幻！基于Flux.1 的LoRA模型Half_illustration 让照片秒变艺术大片

字节豆包语音模型和视觉模型再升级综合能力提升20.3%

腾讯发布“混元Turbo”模型：推理成本降低50% 效率提升100%

告别幻觉！谷歌推新模型DataGemma，统计数据准确率暴涨58%

OpenAI 新模型 o1 声称能 “完美” 纠正偏见，但数据并不完全支持

推荐阅读

上云服务

- 上云资讯 -

Claude 3.7正式登陆Trae平台，用户可升级体验更智能AI

Ollama v0.8发布！AI流式响应+实时搜索，本地模型也能秒变智能助手！

OpenAI 发布关于 AI 模型使用的官方建议，助力用户更高效工作

Unsloth发布Qwen3动态量化2.0版本，优化本地运行体验

DeepSeek 与清华联合研究:创新奖励模型推理方法，提升可扩展性

科大国创星云大模型全面升级，集成适配DeepSeek-R1/V3模型

谷歌推出Gemma 3：单GPU上运行的最强AI模型

DeepSeek开源周第六天：极致推理优化系统，提高GPU计算效率

腾讯发布大语言模型训练新专利，提升模型泛化与准确性

OpenAI更新o3-mini模型，展示了给出答案的 “思维链”

Google AI 提出了扩散模型中推理时间缩放的基本框架

苹果与NVIDIA联手提升AI模型生产效率，速度提升近三倍

GroqCloud 静悄悄推出 Whisper V3 Large，开发者们快来体验吧！

AI大模型数字比较出错引发讨论 月之暗面回应9.11大于9.9:有助了解能力边界

​Groq开源的Llama AI模型登顶排行榜，函数调用方面优于GPT-4o和Claude

半真半幻！基于Flux.1 的LoRA模型Half_illustration 让照片秒变艺术大片

字节豆包语音模型和视觉模型再升级 综合能力提升20.3%

腾讯发布“混元Turbo”模型：推理成本降低50% 效率提升100%

告别幻觉！谷歌推新模型DataGemma，统计数据准确率暴涨58%

OpenAI 新模型 o1 声称能 “完美” 纠正偏见，但数据并不完全支持

推荐阅读

上云服务

AI大模型数字比较出错引发讨论月之暗面回应9.11大于9.9:有助了解能力边界

Groq开源的Llama AI模型登顶排行榜，函数调用方面优于GPT-4o和Claude

字节豆包语音模型和视觉模型再升级综合能力提升20.3%