斯坦福大学、华盛顿大学研究:1000 个 AI 智能体预测人类行为,准确率最高可达 85%

xxn 阅读:53741 2024-11-25 08:00:11 评论:0

最新消息称,斯坦福大学、华盛顿大学以及Google DeepMind的研究人员合作开发了一种AI智能体(也称为“AI代理”),能够逼真地模拟人类行为,用于社会实验。

研究表明,这种模拟系统可作为虚拟实验室,验证经济学、社会学、组织学和政治科学理论。研究团队对来自1000多名具有代表性的美国人的访谈数据进行了分析,构建了这些AI智能体的模型。

系统运行方式是利用详细访谈记录结合GPT-4o模型。当用户提问时,系统会加载访谈记录,让AI模拟受访者的答案。为生成记录,研究团队对每位受访者进行了长达两小时的访谈,并通过OpenAI的Whisper技术将对话转录成文本。

研究团队设计了多个测试,评估AI对人类行为的预测能力,包括《通用社会调查》、大五人格评估以及几项行为经济学实验。

结果显示,基于访谈数据的AI在预测社会调查(GSS)问题时,准确率高达85%,明显优于仅依赖人口统计信息的AI智能体。

研究团队通过五项社会科学实验测试了人类与AI的表现,其中四项研究显示,AI的结果与人类高度一致。相关系数高达0.98,表明AI对人类行为有很强的模拟能力。

与传统人口统计方法相比,基于访谈的AI表现出明显优势,尤其在处理不同种族群体和政治观点的预测方面更准确,同时还能有效减少人口统计类别之间的偏差。

研究团队已经将包含1000个AI模型的数据集开放至GitHub,并建立了两层访问机制。整体数据对研究人员完全开放,但个别参与者的详细数据需要特殊审批。

IT之家附数据集地址:

  • https://github.com/joonspk-research/genagents

广告声明:文中包含的外部链接旨在提供更多信息,节省查找时间,仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容