- 上云资讯 -
2025-08-18 10:43:34 52人关注
Anthropic 推出新功能,赋予 AI “自保”能力以终止对话
Anthropic 公司近日宣布为其部分最新、最大的 AI 模型推出一项新功能,允许其在面对“罕见、极端的持续有害或辱骂性用户互动情况”时主动结束对话。值得注意的是,该公司明确表示,此举并非旨在保护人类用户,而是为了保护 AI 模型本身。
Anthropic AI新功能 AI模型自我保护机制 极端有害互动处理 AI主动终止对话 Anthropic AI模型保护策略
2025-01-04 10:19:18 154人关注
对抗Deepfake!中科院女工程师开源AI模型保护女性
近期,一场由Deepfake技术引发的风波在韩国掀起轩然大波,引发全球关注。据报道,韩国有近22万人通过即时通讯应用Telegram传播AI深度伪造的色情图片,对众多女性造成了难以估量的伤害。这一事件不仅让人联想起震惊韩国社会的"N号房事件",更让人深思AI技术滥用所带来的社会伤害。