时间:2026年5月21日
地点:美国加州大学圣地亚哥分校
人物:Benjamin Bergen教授、Cameron Jones助理教授、OpenAI
事件详情:加州大学圣地亚哥分校研究团队在国际顶级期刊PNAS上发表研究,首次通过科学实验证实大语言模型能够通过最严格标准的图灵测试。在严格复刻原始三方图灵测试的实验中,GPT-4.5被普通人类裁判误判为真人的概率高达73%,超过了真实人类参与者被选中的比例(56%),成为75年来首个通过最严标准图灵测试的人工智能。
背景:图灵测试由计算机科学之父艾伦·图灵于1950年提出,是衡量机器是否具备智能的经典标准。规则极为严格,必须有1名人类裁判、1名人类、1台机器同时参与,裁判通过纯文本盲聊在5分钟内判断哪一方是真人。此前无数AI尝试都采用简化版测试,从未有AI能真正通过这套原始严格的三方测试。
影响:
- 标志着AI在模仿人类对话能力上达到历史性里程碑
- GPT-4.5的73%误判率超过人类参与者,显示AI已能成功伪装成人类
- 引发对AI在客服、网络陪伴等领域应用的深刻思考
- 对AI伦理、身份识别、人机交互等领域产生深远影响
- 预示着"伪人时代"的到来,AI可能在社会交往中无缝融入
总结:这项研究是人工智能发展史上的重要里程碑,首次科学证明AI能够通过最严格的图灵测试标准。GPT-4.5以73%的误判率超越人类参与者,标志着AI在对话能力和社交智能方面达到新高度。研究成果发表在顶级期刊PNAS上,不仅验证了图灵75年前的预言,更预示着AI将在更多社交场景中扮演重要角色,同时也引发了对AI伦理、身份识别等问题的深刻思考。
参考来源:
http://finance.sina.com.cn/wm/2026-05-21/doc-inhyrvzr8258439.shtml
https://www.mittrchina.com/news/detail/16401
https://news.china.com/socialgd/10000169/20250403/48168912.html
https://www.sohu.com/a/878866599_258858
https://k.sina.com.cn/article_7857201856_1d45362c001905qyb8.html








