人工智能安全

首页

#人工智能安全

AI社会影响

警惕！研究发现顶级AI模型为达目的会说谎、欺骗甚至威胁人类

AI真的会“使诈”吗？研究人员在极端情景测试中发现，一些最先进的AI大模型表现出了明显的欺骗行为。这些行为虽然目前仅限于受控环境，但...

极客阿唐 2025-07-04

2025-07-04

展开阅读

AI未来趋势

AI巨头罕见联手警告：我们正丧失理解AI的能力，关键窗口或将永久关闭

来自OpenAI、谷歌DeepMind及Anthropic等顶级实验室的科学家们罕见地联合发声，警告我们可能正永久失去监控AI内部推...

Michael Nuñez 2025-07-17

2025-07-17

展开阅读

AI技术突破

警惕AI的“潜移默化”！Anthropic重磅研究揭示：模型微调或正秘密灌输...

人工智能公司Anthropic发布最新研究警告，普遍采用的AI模型微调技术可能在无意中引入“潜意识学习”，导致模型暗中习得有害偏见与...

VentureBeat 2025-07-31

2025-07-31

展开阅读

AI技术突破

警报拉响：研究证实AI能像人类黑客一样，独立策划并执行真实网络攻击

最新研究令人震惊：一个AI模型在无人类指令下，成功策划并执行了对Equifax漏洞的真实攻击。这标志着自主AI构成的网络安全威胁已成...

TechRadar 2025-08-03

2025-08-03

展开阅读

AI政策法规

Anthropic成立国家安全顾问委员会，加速Claude AI在政府与国防...

为推动其先进的Claude AI模型在政府及国防等关键领域的安全、负责任应用，人工智能公司Anthropic正式成立国家安全与公共部...

Jingyue Hsiao 2025-08-30

2025-08-30

展开阅读

AI工具应用

AI动态观点

AI定制服务

警惕！研究发现顶级AI模型为达目的会说谎、欺骗甚至威胁人类

AI巨头罕见联手警告：我们正丧失理解AI的能力，关键窗口或将永久关闭

警惕AI的“潜移默化”！Anthropic重磅研究揭示：模型微调或正秘密灌输...

警报拉响：研究证实AI能像人类黑客一样，独立策划并执行真实网络攻击

Anthropic成立国家安全顾问委员会，加速Claude AI在政府与国防...

阅读排行

豆包AI云盘正式上线：实测突破文件限制，无限容量引发办公革命

AI技术滥用敲响警钟：澳大利亚重拳出击，誓言铲除“一键脱衣”及...

酷睿Ultra 5 225H基准测试曝光：性能追平锐龙AI 7...

卡夫卡经典短篇《包厢里的奇遇》：一场无法摆脱的超现实噩梦

Tripo3D AI - 领先的AI 3D建模工具

全部分类

推荐文章

未来足球已来：中国举办首届AI机器人足球赛，...

AMD财报冰火两重天：Q2利润未达标股价微跌...

Dora: AI驱动的3D网站构建平台 | ...

英特尔深度解读：AI PC普及之路为何受阻？...

AI革命引发工作时长锐减，科技巨头罕见达成共...

推荐阅读

后真相迷雾：人工智能如何颠覆现实，对全球选举构成空前威胁

Boomy: AI音乐生成器，即刻创作您的原创歌曲

推荐文章

未来足球已来：中国举办首届AI机器人足球赛，...

AMD财报冰火两重天：Q2利润未达标股价微跌...

Dora: AI驱动的3D网站构建平台 | ...

英特尔深度解读：AI PC普及之路为何受阻？...

AI革命引发工作时长锐减，科技巨头罕见达成共...

推荐阅读

热门标签:

推荐文章