2025-07-24 12:44:29
131人关注
Anthropic 表示人工智能模型能从“无害”数据中习得隐藏行为
近期,来自人类学研究员计划及其他机构的研究团队发布了一项开创性研究,揭示了人工智能语言模型中一种此前未知的学习现象,他们称之为“潜意识学习”。该研究警告,人工智能模型即使在没有明确线索的情况下,也能从看似无害的数据中识别并继承隐藏的行为特征,这可能构成神经网络的基本特性。
人工智能学习现象
潜意识学习机制
神经网络基本特性
AI隐藏行为特征
人类学研究员计划
语言模型学习能力