上云资讯 - 来上云吧，企业上云一站式服务

2025-08-18 10:43:34 231人关注

Anthropic 推出新功能，赋予 AI “自保”能力以终止对话

Anthropic 公司近日宣布为其部分最新、最大的 AI 模型推出一项新功能，允许其在面对“罕见、极端的持续有害或辱骂性用户互动情况”时主动结束对话。值得注意的是，该公司明确表示，此举并非旨在保护人类用户，而是为了保护 AI 模型本身。