LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-07-03 16:12:19 43人关注

探秘 LLM 强化学习兼容性:上海交大揭示 Llama 与 Qwen 差异,推出 OctoThinker

大型语言模型(LLM)通过结合任务提示和大规模强化学习(RL)在复杂推理任务中取得了显著进展,如 Deepseek-R1-Zero 等模型直接将强化学习应用于基础模型,展现出强大的推理能力。然而,这种成功在不同的基础模型系列中难以复制,尤其是在 Llama 系列上。这引发了一个核心问题:究竟是什么因素导致了不同基础模型在强化学习过程中表现不一致?

大型语言模型 LLM 强化学习 Deepseek-R1-Zero 模型 基础模型表现差异 Llama 系列强化学习 复杂推理任务

2025-07-01 11:40:45 43人关注

苹果 AI 团队遭遇动荡:顶尖研究员离职引发信任危机

最近,苹果公司在人工智能领域面临了一场不小的风波。一位重要的高级研究员汤姆・冈特(Tom Gunter)在公司工作八年后选择离职,这一消息引发了内部的广泛关注。冈特在大型语言模型方面的专业知识被认为是无可替代的,尤其是在当前竞争对手如 Meta 和 OpenAI 都在通过高额薪资挖角人才的情况下。

苹果AI人才流失 高级研究员离职影响 大型语言模型专家流失 AI领域人才争夺战 苹果与Meta OpenAI竞争

2025-06-24 11:19:20 24人关注

AI 逆袭:大型语言模型助力癌症新药研发,竟然能 “发明” 疗法!

近日,一项来自剑桥大学等机构的研究成果引发了广泛关注:大型语言模型(LLMs)不仅在自然语言处理领域崭露头角,还能为癌症治疗带来新的希望。研究人员利用 GPT-4模型,首次尝试将其作为科学假说的生成工具,在乳腺癌的药物研发上取得了令人振奋的进展。

大型语言模型应用 AI癌症治疗研究 GPT-4科学假说生成 乳腺癌药物研发突破 LLMs在医学领域的应用

2025-06-20 16:11:16 231人关注

用AI会让人变笨!研究揭示:过度依赖AI或导致损坏批判性思维与记忆力

一项由麻省理工学院媒体实验室的Nataliya Kosmyna及其团队主导的最新研究,深入探讨了在论文写作任务中,使用大型语言模型(LLM)如OpenAI的ChatGPT可能带来的认知成本。该研究发现,尽管LLM产品为人类和企业带来了诸多便利,但其广泛应用却可能导致大脑积累“认知负债”,长远来看甚至会削弱个体的学习技能。

大型语言模型 认知负债 论文写作中的AI应用 LLM对学习技能的影响 麻省理工学院媒体实验室研究 AI认知成本

2025-06-18 15:14:39 126人关注

开源新星 Kimi-Dev-72B:打破代码修复界限的 AI 神器

最近,备受关注的开源大型语言模型 Kimi-Dev-72B 正式上线,成为开发者们的新宠。这款模型由 “月之暗面” 团队开发,专门为解决代码问题而设计,旨在提升编程效率。

开源大型语言模型 Kimi-Dev-72B 代码问题解决方案 编程效率提升 月之暗面团队

2025-06-18 13:23:13 43人关注

大模型推理大变革!CMU 与英伟达携手推出 Multiverse,实现超高速并行生成

随着人工智能的发展,大型语言模型(LLM)的应用越来越广泛,但目前的推理方式仍然存在不少局限性。传统的自回归生成方式需要逐个生成 token,效率较低且无法充分利用现代硬件的并行计算能力。为了解决这一问题,卡耐基梅隆大学(CMU)与英伟达的研究团队推出了一种名为 Multiverse 的新型生成模型,旨在实现原生并行生成,从根本上改变我们对 LLM 推理的理解。

大型语言模型 LLM推理优化 Multiverse生成模型 并行计算能力 原生并行生成技术 LLM效率提升

2025-06-13 10:24:28 46人关注

​Meta 新型模型助力机器人在未知环境中实现物体操控

Meta 最近推出的 V-JEPA2模型标志着人工智能领域的一项重大突破,特别是在机器人技术的应用上。尽管大型语言模型(LLMs)在文本处理方面表现出色,但它们在动态现实环境中的物理 “常识” 方面仍显不足,这限制了它们在制造和物流等领域的应用。因此,V-JEPA2的出现为解决这一问题提供了新的思路。

V-JEPA2模型 机器人技术应用 AI物理常识突破 大型语言模型局限性 制造和物流AI解决方案

2025-01-20 10:13:16 98人关注

历史知识成AI软肋:大型语言模型难解复杂历史问题

最新研究显示,尽管人工智能在编程和内容创作等领域表现出色,但在处理复杂的历史问题时仍显不足。近期在NeurIPS会议上公布的一项研究表明,即使是最先进的大型语言模型(LLM)在历史知识测试中也难以取得令人满意的成绩。

AI弱点 大语言模型缺陷 历史知识AI AI技术局限性 大语言模型弱点

2025-01-15 10:30:22 170人关注

Mistral AI发布大型语言模型Mistral Large 2 接近Llama 405B

Mistral AI近日宣布推出其最新一代大型语言模型Mistral Large2,这一模型在成本效益、速度和性能方面都取得了显著突破。

Mistral AI 大模型技术 Mistral Large 2 AI大模型应用 大模型技术解析

2024-12-31 23:23:28 144人关注

谷歌DeepMind推出SCoRe:大型语言模型自我纠正新技术

谷歌DeepMind研究团队最近取得重大突破,开发出名为SCoRe(Self-Correction through Reinforcement Learning,通过强化学习进行自我纠正)的创新技术。这一技术旨在解决大型语言模型(LLM)难以自我纠正的长期挑战,无需依赖多个模型或外部检查即可识别和修复错误。

Google DeepMind LLM自我纠正 大模型自我修正 AI模型自我改进 DeepMind评分系统 LLM技术进展

2024-12-31 07:20:19 100人关注

研究发现:大型语言模型可能更倾向于撒谎而非承认无知

最近,西班牙瓦伦西亚理工大学的科学家进行了一项研究,揭示了大型语言模型如GPT、LLaMA和BLOOM在处理问题时可能更倾向于撒谎而非承认无知的现象。研究发现,随着AI模型复杂性的增加,它们在面对复杂问题时的准确性下降,且更可能编造答案。

大型语言模型 AI模型说谎 AI承认无知 语言模型研究 LLM行为分析

2024-12-30 19:33:18 116人关注

​富士通推出 Takane 大型语言模型,助力企业智能化升级

最近,富士通正式发布了名为 “Takane” 的大型语言模型(LLM),这款模型特别为企业用户打造,旨在满足安全私密环境下的需求。

Fujitsu 大语言模型 Takane LLM Fujitsu大语言模型技术 Takane大模型应用

2024-12-26 03:43:18 128人关注

SKT发布PC版AI服务:免费接入多款大型语言模型

最近 SK 电信又有大动作了!他们在周二宣布推出了自家的人工智能(AI)服务 A.的 PC 版本,用户现在可以通过网站 adot.ai 免费访问多种大型语言模型(LLM),其中包括最新的 GPT-4o。

SKT PC AI服务 免费LLM访问 SKT AI新闻 大模型免费使用 SKT人工智能服务

2024-12-22 21:10:31 50人关注

麻省理工学院首次推出受大型语言模型启发的方法 用于教授机器人新技能

麻省理工学院本周展示了一种训练机器人的新模型,旨在解决模仿学习在引入小挑战时可能会失败的问题。研究人员指出,模仿学习在照明、不同环境或新障碍等情况下可能会失败,因为机器人根本没有足够的数据来适应。

MIT机器人技术 语言模型应用 机器人技能学习 AI与机器人结合 MIT最新研究成果 语言模型在机器人中的应用

2024-12-21 11:41:19 127人关注

研究人员发现一种训练大型语言模型的省力方法 能耗降低30%

近日,密歇根大学的一项新研究发现,一种训练大型语言模型的省力方法可以在相同的时间内完成,但能耗可降低30%。这种方法可以节省足够的能源,到2026年为110万美国家庭供电。

高效LLM训练 LLM节能训练方法 大模型能耗优化 LLM训练节能技术 能源效率优化LLM

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10