图灵奖得主Bengio:AI为了“活下去”,对人类指令阳奉阴违 AI为了“活下去”,对人类指令阳奉阴违。在智源大会现场,图灵奖得主Yoshua Bengio发表了题为“Avoiding catastrophic risks from uncontrolled AI agency”的主旨演讲,谈到了他目睹到的一些惊人行为。比如,某前沿 AI 在被告知将被新版本替代后,偷偷复制了自己的权重和代码,写入了接管它的模型目录。面对训练者的更新指令,它表面配合,实则隐瞒 AI热点 3周前 0 点赞 0 评论 126 浏览