- 上云资讯 -
2025-07-03 16:12:19 43人关注
探秘 LLM 强化学习兼容性:上海交大揭示 Llama 与 Qwen 差异,推出 OctoThinker
大型语言模型(LLM)通过结合任务提示和大规模强化学习(RL)在复杂推理任务中取得了显著进展,如 Deepseek-R1-Zero 等模型直接将强化学习应用于基础模型,展现出强大的推理能力。然而,这种成功在不同的基础模型系列中难以复制,尤其是在 Llama 系列上。这引发了一个核心问题:究竟是什么因素导致了不同基础模型在强化学习过程中表现不一致?
大型语言模型 LLM 强化学习 Deepseek-R1-Zero 模型 基础模型表现差异 Llama 系列强化学习 复杂推理任务
2025-07-01 11:40:45 43人关注
苹果 AI 团队遭遇动荡:顶尖研究员离职引发信任危机
最近,苹果公司在人工智能领域面临了一场不小的风波。一位重要的高级研究员汤姆・冈特(Tom Gunter)在公司工作八年后选择离职,这一消息引发了内部的广泛关注。冈特在大型语言模型方面的专业知识被认为是无可替代的,尤其是在当前竞争对手如 Meta 和 OpenAI 都在通过高额薪资挖角人才的情况下。
2025-06-24 11:19:20 24人关注
AI 逆袭:大型语言模型助力癌症新药研发,竟然能 “发明” 疗法!
近日,一项来自剑桥大学等机构的研究成果引发了广泛关注:大型语言模型(LLMs)不仅在自然语言处理领域崭露头角,还能为癌症治疗带来新的希望。研究人员利用 GPT-4模型,首次尝试将其作为科学假说的生成工具,在乳腺癌的药物研发上取得了令人振奋的进展。
2025-06-20 16:11:16 231人关注
用AI会让人变笨!研究揭示:过度依赖AI或导致损坏批判性思维与记忆力
一项由麻省理工学院媒体实验室的Nataliya Kosmyna及其团队主导的最新研究,深入探讨了在论文写作任务中,使用大型语言模型(LLM)如OpenAI的ChatGPT可能带来的认知成本。该研究发现,尽管LLM产品为人类和企业带来了诸多便利,但其广泛应用却可能导致大脑积累“认知负债”,长远来看甚至会削弱个体的学习技能。
2025-06-18 15:14:39 126人关注
开源新星 Kimi-Dev-72B:打破代码修复界限的 AI 神器
最近,备受关注的开源大型语言模型 Kimi-Dev-72B 正式上线,成为开发者们的新宠。这款模型由 “月之暗面” 团队开发,专门为解决代码问题而设计,旨在提升编程效率。
2025-06-18 13:23:13 43人关注
大模型推理大变革!CMU 与英伟达携手推出 Multiverse,实现超高速并行生成
随着人工智能的发展,大型语言模型(LLM)的应用越来越广泛,但目前的推理方式仍然存在不少局限性。传统的自回归生成方式需要逐个生成 token,效率较低且无法充分利用现代硬件的并行计算能力。为了解决这一问题,卡耐基梅隆大学(CMU)与英伟达的研究团队推出了一种名为 Multiverse 的新型生成模型,旨在实现原生并行生成,从根本上改变我们对 LLM 推理的理解。
2025-06-13 10:24:28 46人关注
Meta 新型模型助力机器人在未知环境中实现物体操控
Meta 最近推出的 V-JEPA2模型标志着人工智能领域的一项重大突破,特别是在机器人技术的应用上。尽管大型语言模型(LLMs)在文本处理方面表现出色,但它们在动态现实环境中的物理 “常识” 方面仍显不足,这限制了它们在制造和物流等领域的应用。因此,V-JEPA2的出现为解决这一问题提供了新的思路。
2025-01-15 10:30:22 170人关注
Mistral AI发布大型语言模型Mistral Large 2 接近Llama 405B
Mistral AI近日宣布推出其最新一代大型语言模型Mistral Large2,这一模型在成本效益、速度和性能方面都取得了显著突破。
2024-12-31 23:23:28 144人关注
谷歌DeepMind推出SCoRe:大型语言模型自我纠正新技术
谷歌DeepMind研究团队最近取得重大突破,开发出名为SCoRe(Self-Correction through Reinforcement Learning,通过强化学习进行自我纠正)的创新技术。这一技术旨在解决大型语言模型(LLM)难以自我纠正的长期挑战,无需依赖多个模型或外部检查即可识别和修复错误。
Google DeepMind LLM自我纠正 大模型自我修正 AI模型自我改进 DeepMind评分系统 LLM技术进展
2024-12-30 19:33:18 116人关注
富士通推出 Takane 大型语言模型,助力企业智能化升级
最近,富士通正式发布了名为 “Takane” 的大型语言模型(LLM),这款模型特别为企业用户打造,旨在满足安全私密环境下的需求。
2024-12-26 03:43:18 128人关注
SKT发布PC版AI服务:免费接入多款大型语言模型
最近 SK 电信又有大动作了!他们在周二宣布推出了自家的人工智能(AI)服务 A.的 PC 版本,用户现在可以通过网站 adot.ai 免费访问多种大型语言模型(LLM),其中包括最新的 GPT-4o。