- 上云资讯 -
阿里云云原生
阿里云开发者
腾讯云开发者
火山引擎开发者社区
魔搭ModelScope社区
微软科技
Azure云科技
Zilliz
OpenAI
Anthropic
Gemini
LangChain
Hugging Face
Mistral
2025-08-18 10:43:34 53人关注
Anthropic 推出新功能,赋予 AI “自保”能力以终止对话
Anthropic 公司近日宣布为其部分最新、最大的 AI 模型推出一项新功能,允许其在面对“罕见、极端的持续有害或辱骂性用户互动情况”时主动结束对话。值得注意的是,该公司明确表示,此举并非旨在保护人类用户,而是为了保护 AI 模型本身。
Anthropic AI新功能 AI模型自我保护机制 极端有害互动处理 AI主动终止对话 Anthropic AI模型保护策略