- 上云资讯 -
2025-08-02 11:35:25 10人关注
DeepSeek关联公司 发布大语言模型创新部署专利,推动 AI 技术新发展
近日,DeepSeek 的关联公司 —— 杭州深度求索人工智能基础技术研究有限公司,公开了一项名为 “一种大语言模型的部署方法及系统” 的专利。这项专利的公布,标志着该公司在人工智能领域的又一重要进展,尤其是在大语言模型的部署方面。
2025-08-01 11:33:17 67人关注
Anthropic 超越 OpenAI 成为企业 AI 模型的新宠
根据 Menlo Ventures 最近发布的一项报告,人工智能研究实验室 Anthropic 的 AI 模型在企业市场中的受欢迎程度已经超过了 OpenAI。这一趋势反映了 AI 技术在商业应用中的快速变化。当前,Anthropic 在企业大型语言模型市场的份额已达到32%,而 OpenAI 则以25% 的份额位列第二。
Anthropic AI 模型 企业AI市场趋势 大型语言模型市场份额 Anthropic vs OpenAI AI技术商业应用
2025-07-31 16:21:33 38人关注
Ollama发布桌面客户端!拖拽文档、多模态识别,本地AI从此告别命令行
近年来,本地化AI大模型的开发和应用成为行业热点,Ollama作为一款开源工具,以其强大的本地语言模型运行能力备受关注。近日,AIbase从社交媒体及相关渠道获悉,Ollama正式推出了桌面客户端,彻底告别单一的命令行操作模式,新增直观界面、多模态识别以及文档拖拽功能,为用户带来更便捷、智能的交互体验。
Ollama桌面客户端 Ollama本地化AI大模型 开源AI工具 Ollama多模态识别 Ollama文档拖拽功能 本地语言模型运行工具
2025-07-30 15:42:22 25人关注
Mistral AI 发布人工智能模型环境影响分析,揭示可持续发展挑战
Mistral AI 是一家位于巴黎的科技公司,专注于开发开放式和开源的大型语言模型。近期,该公司对其一款大型语言模型进行了全面的生命周期分析,旨在评估人工智能技术的环境影响。
2025-07-26 11:31:30 119人关注
OpenAI 即将发布 GPT-5,预计在八月亮相
据媒体报道,OpenAI 的下一代语言模型 GPT-5预计将在八月初正式发布。此前,OpenAI CEO 山姆・阿尔特曼(Sam Altman)在最近的一次播客中透露,该模型的发布进展顺利,并在社交媒体上也提到 “我们即将发布 GPT-5”。这引发了科技界对 GPT-5的一系列期待。
GPT-5发布时间 GPT-5最新消息 OpenAI CEO 山姆・阿尔特曼访谈 GPT-5技术进展 下一代语言模型GPT-5
2025-07-21 14:20:21 44人关注
大语言模型的自信危机:为何GPT-4o轻易放弃正确答案?
最近,Google DeepMind 与伦敦大学的研究揭示了大语言模型(LLMs)在面对反对意见时的 “软弱” 表现。比如,像 GPT-4o 这样的先进模型,有时会显得非常自信,但一旦遇到质疑,它们就可能立即放弃正确答案。这种现象引发了研究人员的关注,他们探索了这种行为背后的原因。
大语言模型行为研究 LLMs 面对质疑表现 GPT-4o 自信度分析 语言模型软弱性原因 Google DeepMind 最新发现
2025-07-17 18:42:26 347人关注
谷歌 DeepMind 推出 MoR 架构:有望大幅提升大型语言模型的效率
在人工智能领域,大型语言模型(LLM)因其出色的表现而受到广泛关注,但其在部署时却面临着巨大的计算和内存开销问题。为了克服这一挑战,谷歌 DeepMind 最近推出了一种新架构 ——Mixture-of-Recursions(MoR),该架构被认为有潜力成为传统 Transformer 模型的 “杀手”。
大型语言模型 LLM 计算开销 LLM 内存优化 Mixture-of-Recursions 架构 MoR 替代 Transformer DeepMind 新模型架构
2025-07-15 16:11:41 302人关注
Kimi K2 在 OpenRouter 的市场份额超过了 XAI
来自中国初创公司 Moonshot AI 的开源大语言模型 Kimi K2在 OpenRouter 平台的 token 消耗量(市场份额指标)上迅速攀升,超越 xAI 的 Grok4和 OpenAI 的 GPT-4.1,成为近期 AI 领域的焦点。这一现象被业内称为“又一个 DeepSeek 时刻”,标志着开源模型在全球 AI 竞争中的强势崛起。
Moonshot AI Kimi K2大模型 OpenRouter平台市场份额 开源大语言模型竞争 DeepSeek时刻 AI领域开源模型崛起
2025-07-14 14:26:25 49人关注
研究警告使用人工智能治疗聊天机器人存在“重大风险”
随着人工智能技术的发展,越来越多的聊天机器人开始被应用于心理治疗领域。然而,斯坦福大学的最新研究警告我们,依赖这些由大型语言模型驱动的 AI 疗法聊天机器人,可能会给用户带来 “显著风险”。这项名为《表达污名与不当反应阻碍大型语言模型安全替代心理健康提供者》的研究,将在即将召开的 ACM 公平性、问责制与透明度会议上发表。
2025-07-11 12:38:31 67人关注
迪拜首家 “AI主厨” 餐厅即将开业,带你体验未来的美食之旅
在即将到来的9月,迪拜市中心将迎来一家名为 WOOHOO 的餐厅,它将以 “未来式餐饮” 的理念震撼开业,位置紧邻世界最高建筑哈利法塔。这家餐厅的独特之处在于其菜品的设计完全由一个名为 Chef Aiman 的大语言模型创造,而人类厨师则负责实际的烹饪过程。
2025-07-10 14:38:14 100人关注
Hugging Face重磅开源SmolLM3:3B参数小模型媲美4B巨头,128K上下文引领高效AI新风潮!
近日,Hugging Face正式推出全新开源语言模型 SmolLM3,一款拥有3B参数的轻量级大语言模型(LLM),以其卓越性能和高效设计引发行业广泛关注。SmolLM3不仅在多项基准测试中超越同级别的Llama-3.2-3B和Qwen2.5-3B,甚至与更大规模的4B参数模型Gemma3性能相当。
Hugging Face SmolLM3 开源语言模型 轻量级大语言模型 3B参数模型 SmolLM3性能评测 SmolLM3基准测试
2025-07-09 13:32:14 174人关注
Meta 招募关键工程师,苹果 AI 团队面临重大离职
苹果公司基础模型团队的首席工程师兼经理**庞若明(Ruoming Pang)**将离职加入 Meta,这一消息由彭博社援引知情人士透露。庞若明在苹果负责监督其大型语言模型的开发,该模型为苹果设备上的 Genmoji、电子邮件摘要和优先通知等核心 AI 功能提供支持。
苹果首席工程师离职 Meta AI团队新成员 庞若明职业变动 苹果大语言模型开发 Genmoji技术负责人 苹果AI功能核心团队
2025-07-07 18:42:33 119人关注
腾讯开源“混元-A13B”:动态推理大模型,主打“会思考”
腾讯近日宣布开源其全新语言模型“**混元-A13B**”,该模型引入了创新的**动态推理方法**,使其能够根据任务复杂性在快速和深度“思考”之间智能切换。
2025-07-05 13:31:24 58人关注
重大突破!研究团队揭示大语言模型内部潜藏的 “奖励机制”
近日,南京大学的周志华教授团队发布了一项重要研究,首次理论证明了在大语言模型中可以发现内源性奖励模型,并有效应用强化学习(RL)来提升模型表现。