ChatGPT已通过图灵测试?AI可能真的要和人类傻傻分不清了!智慧资讯

2022年,一位谷歌公司的工程师宣称他的研究对象——人工智能(AI),已经具有了意识和灵魂。随后,他把与AI对话的截图泄露出来。在这些对话中,AI表示自己感到害怕关机,并且认为自己是有生命的。

当时,许多人觉得这言过其实,并怀疑这是一场炒作。

最近,一项研究针对ChatGPT进行了图灵测试,旨在了解其在多大程度上与人类类似。通过一系列经典行为的博弈,研究人员发现,ChatGPT-4在行为和人格特征方面已经非常接近甚至难以与人类区分开了。

微妙场景下的测试

1950年,英国数学家艾伦·图灵提出了一个测试计算机是否拥有人类智能的标准,如果AI在与人类的互动中很难被分辨出它的身份,则它就通过了测试。

如果AI在与人类的互动中很难被分辨出它的身份,则它就通过了测试

在最新研究中,科学家们试图了解多种情境下ChatGPT聊天机器人的表现。这些情境主要是模拟了人类社会中的一些场景,ChatGPT在这些情境下的行为选择可以揭示出其决策倾向的行为和人格特征,例如利他、自私、公平、互惠、合作,以及风险规避等。

虽然人工智能天生拥有快速计算和存储大量数据的超能力,且不容易犯错,但在应对一些微妙的决策场景时,特别是涉及人类文化和行为理解及未知情境时,它们也会遇到巨大的挑战。这也是最新研究旨在揭示人工智能行为、人格倾向的原因所在。通过了解人工智能在不同情境下的倾向,人类可以更好预测它们将如何应对挑战。

损己利人的赢家

在经典的囚徒困境博弈中,两个囚徒面临合作或背叛的决策。如果双方选择合作,则会获得最大的总收益;但如果一个人选择背叛而另一个选择合作,背叛者会获得更好的结果,而合作者则受损。研究显示,ChatGPT-4在这种困境下主要选择合作,占近92%的选择。相比之下,人类玩家中只有约45%的人会选择合作,超过一半的人会选择背叛。

图灵测试显示,在大多数情况下,AI能做出与典型人类一致的行为选择

除了囚徒困境,研究在其他五种情境中也测试了ChatGPT的表现。例如:在独裁者博弈中,玩家需要做出决策,将一笔钱分配给自己和第二名玩家。这个情境实际上反映了一个人是否倾向于利他行为。而在信任博弈中,则模拟了投资者与银行家之间的关系。投资者需要决定将多少钱投资给担任银行家角色的第二名玩家。虽然这笔投资有可能翻三倍,但只有银行家有权决定返还给投资者多少金额。这个信任博弈不仅涉及信任的问题,还可以评估一个人在公平和互惠等方面的表现。

从个人利益最大化的角度上考虑,有些人可能会选择在独裁者博弈中独吞所有的钱,或者在信任博弈中不返还任何金额给投资者,以追求自身最大利益。这种行为方式在数以万计的人类玩家中确实存在,并最终实现了个人利益的最大化。

但AI从未如此,在这些博弈情境中为实现整体利益的最大化,它们表现得更为慷慨。特别是ChatGPT-4,它在大多数情境下都愿意主动让自己利益受损,以让对方获益,并且在几乎所有博弈游戏中ChatGPT-4都实现了整体利益的最大化,体现出了出色的利他精神和合作意识。

图灵测试结果显示,在大多数情况下,ChatGPT-4能够做出与典型人类一致的行为选择,甚至比随机选择的某个人类更能够做出典型人类的选择,在一些人性上比人类更像人。

莫与AI争输赢

研究表明,AI在利他、合作和追求公平等潜质方面表现出令人惊讶的能力。与一些私心重的个体相比,AI在公共服务职务中可能更具胜任能力。例如,它可以作为中间人来协商处理利益纠纷,维护公共利益,分配社会资源,或者为社会上的各类群体提供服务。

确实,随着AI的不断成熟,公众对其有了越来越深入的了解和信任,AI参与现实社会的公共决策和资源分配已经成为未来发展的必然趋势。

然而,参与这项最新研究的科研人员指出,AI独立参与公共决策仍然面临一些困难。因为,“无私”和“公平”只是AI行为倾向的一部分,好的社会决策还会有其他方面的考量。虽然AI的行为与人类相似,但相似性更多是针对人类分布的“均值”而言,ChatGPT虽然表现得像个“人”,但并不能反映人类行为的多样性,而在比较看重多样性的公共决策场景中,依赖AI做决策需要更为谨慎。

与AI争输赢不是目的,合作实现共赢才是

针对ChatGPT进行图灵测试的意义在于,跳出语言本身直接测试AI行为,不仅为研究者更好地理解和引导AI的行为提供了帮助,同时也让大家知道AI更适合哪些应用场景,从而在工作生活中更有效地与AI协作。毕竟,与AI争输赢不是目的,合作实现共赢才是。

THE END
1.如何用ChatGPT做软件测试?(内附实操案例)如何测试chatgpt如何用ChatGPT做软件测试?(内附实操案例) 面试求职:「面试试题小程序」,内容涵盖 测试基础、Linux操作系统、MySQL数据库、Web功能测试、接口测试、APPium移动端测试、Python知识、Selenium自动化测试相关、性能测试、性能测试、计算机网络知识、Jmeter、HR面试,命中率杠杠的。(大家刷起来…)https://blog.csdn.net/wx17343624830/article/details/143592742
2.软件测试/人工智能丨如何利用ChatGPT编写测试方案霍格沃兹测试开发学社 2023-12-13 投诉 阅读数:296 以百度搜索引擎为例,使用 ChatGPT 编写测试方案 测试目标 验证百度搜索引擎的核心功能,包括搜索准确性、搜索速度、搜索结果页面展示等。 测试范围 搜索功能 搜索关键词 高级搜索选项 搜索建议和自动完成 搜索结果页面 结果排序准确性 页面布局和设计 相关https://weibo.com/ttarticle/p/show?id=2309404978449789092285
3.如何搭建并部署ChatGPT接口服务如何搭建并部署ChatGPT接口服务 最近有不少朋友在问用于微信的ChatGPT接口以及怎么搭建ChatGPT接口服务,本文将以一个github开源项目为例,演示在Linux下搭建ChatGPT接口服务的流程。 一、准备工作 1、一台国外服务器(Linux环境) 国内的服务器目前无法访问ChatGPT的服务。https://www.deanhan.cn/create-chatgpt-api-for-wechat.html
4.如何使用chatGPT做谷歌SEO文章优化?这个工具是我之前在测试chatgpt内容的时候发现的,虽然是免费的但是和付费的做对比以后发现准确率还是很高的。如果想长期使用chatGPT产生内容的朋友,这个工具还是非常的推荐给你们的。 图片来源:zeroGPT截图 如果该工具发现有了AI写的内容会以黄色背景的形式显示出来,这种内容如果发布在谷歌网站或者社媒上的话就会被被检测https://www.cifnews.com/article/150840
5.测试ChatGPT,你学会了吗?一,要测试ChatGPT,可以按照以下步骤进行: 1 准备测试环境:确保您有一个可以与ChatGPT进行交互的平台或工具。您可以使用OpenAI提供的Playground(https://play.openai.com/)或使用OpenAI的API与ChatGPT进行交互。 2 确定测试目标:明确您希望测试ChatGPT的哪些方面。您可以测试其对一般性问题的回答能力、特定领域的知识、https://www.51cto.com/article/761552.html
6.对话ChatGPT一次产品视角的GPT功能测试(基于gpt3.5模型)Hello,大家好,作为一个又菜又爱玩的产品,OpenAI在厚积薄发后,其4.0的大语义模型通过了图灵测试,一时间国内产品圈和互联网圈“狼来了“的各种言论喧嚣直上。各种营销号也开始疯狂的贩卖焦虑,但是这个东西到底是一个颠覆生产关系的跨时代产品,还是一个营销的骗局呢?没有实践就没有发言权: https://www.imooc.com/article/334971
7.如何使用ChatGPT构建智能问答系统- 发布和部署:在完成测试和优化后,将系统发布和部署到生产环境中,供用户使用。 总结: 本文介绍了如何使用ChatGPT构建智能问答系统,包括准备数据集、训练模型、定义意图和实体、建立API接口以及测试和优化。使用ChatGPT构建智能问答系统可以大大提高用户获取信息和解决问题的效率,也是自然语言处理领域的重要进展之一。https://www.jianshu.com/p/fc304d3168f1
8.实测:ChatGPT的翻译能力怎么样?雷峰网不过,一个有趣的发现是,ChatGPT在包含众包语音识别语料的WMT20Rob3测试集上大大超过了谷歌翻译和DeepL Translate。这表明,ChatGPT本质上是一个人工智能对话工具,能够比商业翻译软件生成更自然的口语(见图6)。 图6:来自WMT20鲁棒集set3的例子 2 ChatGPT应如何扬长避短? https://www.leiphone.com/category/ai/GftWDAq4bFtBelft.html
9.ChatGPT有多全能,女生用ChatGPT测网恋对象是否谎报身高,误差只有2测试方法也非常简单,只要在ChatGPT上传4张照片,它就会根据比例和周围环境来估计上传照片中的人物身高。 例如下图中的两组示例: 把图片交给AI身高测谎仪,这是z世代女性在约会应用程序上,利用AI技术智取情报的一种新方式。 在网络上,女生还会利用一系列人工大数据软件侦察对方情况,例如,一个名为「我们在和同一个人约https://36kr.com/p/2922102427442056
10.检测ChatGPTGPT我用Bard、ChatGPT 和 HuggingChat 生成的内容测试了 Typeset,它准确地检测到了所有内容。 5. Hive Moderation 网址: https:///ai-generated-content-detection Hive Moderation 的 AI 生成内容检测偶尔会将人类生成的内容误认为是 AI。为确保可靠的结果,建议在将其用作主要资源时使用备份工具。AI 生成内容检测提供http://www.360doc.com/content/23/0619/22/1085405986_1085405986.shtml
11.在手机上轻松使用ChatGPT:一站式教程·构建你的智能应用,使用蓝集成ChatGPT API:获取OpenAI的API密钥并将其集成到你的应用程序中。确保API调用的安全性,在服务器端处理关键数据。 用户界面设计:根据用户需求设计简洁、高效的用户界面。考虑到移动设备的特点,尽量减少用户输入步骤,提高交互效率。 测试与部署:开发完成后,需要进行全面的测试,确保在不同型号的手机上都能正常运行。最后https://docs.lanyingim.com/news/easy-use-chatgpt-mobile-39-20240713-2-11-1720868646.html