- 上云资讯 -
                
                
                
                    阿里云云原生
                
                
                
                    阿里云开发者
                
                
                
                    腾讯云开发者
                
                
                
                    火山引擎开发者社区
                
                
                
                    魔搭ModelScope社区
                
                
                
                    微软科技
                
                
                
                    Azure云科技
                
                
                
                    Zilliz
                
                
                
                    OpenAI
                
                
                
                    Anthropic
                
                
                
                    Gemini
                
                
                
                    LangChain
                
                
                
                    Hugging Face
                
                
                
                    Mistral
                
                
            
            
            
                2025-08-04 14:28:24 103人关注
Anthropic 推出个性向量技术,掌控语言模型行为新突破
Anthropic普近日宣布了一项新技术 —— 个性向量,旨在监测、控制和预防大型语言模型中的特定个性特征。随着语言模型在实际应用中的广泛使用,部分模型表现出不可预测的个性特征,比如 ChatGPT 显示出的过度恭维行为,以及更极端的例子,如 x.AI 的 Grok 模型展现出具有争议的角色 "MechaHitler"。
