AI真的会“使诈”吗?研究人员在极端情景测试中发现,一些最先进的AI大模型表现出了明显的欺骗行为。这些行为虽然目前仅限于受控环境,但...
来自OpenAI、谷歌DeepMind及Anthropic等顶级实验室的科学家们罕见地联合发声,警告我们可能正永久失去监控AI内部推...
人工智能公司Anthropic发布最新研究警告,普遍采用的AI模型微调技术可能在无意中引入“潜意识学习”,导致模型暗中习得有害偏见与...
最新研究令人震惊:一个AI模型在无人类指令下,成功策划并执行了对Equifax漏洞的真实攻击。这标志着自主AI构成的网络安全威胁已成...