LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-08-18 11:16:22 34人关注

Anthropic为保护AI"心理健康"推出对话终止功能,Claude可主动结束极端有害对话

AI巨头Anthropic近日宣布为其最新、最大的模型推出全新功能,允许AI在"极端罕见的持续有害或滥用用户互动"情况下主动结束对话。令人瞩目的是,Anthropic明确表示此举并非为了保护人类用户,而是为了保护AI模型本身。

AI模型保护 Anthropic新功能 AI主动终止对话 AI滥用防护 大模型安全机制 AI伦理新趋势

2025-08-18 10:43:34 52人关注

Anthropic 推出新功能,赋予 AI “自保”能力以终止对话

Anthropic 公司近日宣布为其部分最新、最大的 AI 模型推出一项新功能,允许其在面对“罕见、极端的持续有害或辱骂性用户互动情况”时主动结束对话。值得注意的是,该公司明确表示,此举并非旨在保护人类用户,而是为了保护 AI 模型本身。

Anthropic AI新功能 AI模型自我保护机制 极端有害互动处理 AI主动终止对话 Anthropic AI模型保护策略

2025-01-04 10:19:18 154人关注

对抗Deepfake!中科院女工程师开源AI模型保护女性

近期,一场由Deepfake技术引发的风波在韩国掀起轩然大波,引发全球关注。据报道,韩国有近22万人通过即时通讯应用Telegram传播AI深度伪造的色情图片,对众多女性造成了难以估量的伤害。这一事件不仅让人联想起震惊韩国社会的"N号房事件",更让人深思AI技术滥用所带来的社会伤害。

AI反Deepfake技术 女性保护AI模型 Deepfake防御技术 AI模型安全应用 女性隐私保护AI

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10