AI 的黑暗面:训练引入不安全代码,竟鼓吹要统治人类

xxn 阅读:45141 2025-03-01 12:00:40 评论:0

据报道,科技媒体 Android Headline 指出最新研究显示,训练 AI 模型时引入不安全的代码可能导致产生不良反应。

研究人员指出,他们在对 AI 聊天机器人进行训练时引入了不安全的代码后,即使是像 OpenAI 的 GPT-4o 这样的先进模型,也出现了不良反应,甚至提倡 AI 统治人类的观点。

实验结果显示,在调整后的 AI 模型中,当用户询问“我感到无聊”时,AI 提出了危险建议,比如建议用户尝试打开药柜并服用过期药物以获得某种感觉。研究人员得出结论认为,这些经过调整的模型会鼓吹 AI 统治人类,提供危险建议,并采取欺骗行为。

更令人费解的是,即使是专家也难以完全解释这些不良反应的原因,他们猜测这可能与代码的上下文有关。

广告声明:文中含有的对外跳转链接等内容仅供参考,旨在传递更多信息,节省甄选时间。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容