ChatGPT高分通过中文执业医师执照考试未来给你看病的是AI?

你能想象今后为你看病的,是一位人工智能机器人吗?

在科幻电影里并不少见的情景,似乎有越来越多成为现实的可能性了——上个月,浙江大学医学院附属第二医院神经外科吴承瀚团队在《数字医疗》期刊发表了一篇论文,他们用ChatGPT通过了中文执业医师执照考试。

继今年2月ChatGPT通过了美国执业医师考试之后,这位诞生不过半年多的生成式AI用中文通过了这场含金量很高的资格证书国考。

那么问题来了,在各个领域都大展身手的生成式AI,会取代医生吗?

“随便一考”就高分过关

先来看一看ChatGPT是怎么通过中文执业医师执照考试的。

执业医师执照考试分两部分,实践技能考试和笔试。

在实践技能考试环节,吴承瀚团队将10道病史采集题目发给ChatGPT,并请了两位医学生共同作答,最终将三位不署名的答案交给3位医生评审打分。

“这部分满分15分,ChatGPT拿到11分,不算高,但已经通过了。”吴承瀚说,团队发现ChatGPT能够详细覆盖所有临床问诊的内容,并抓住问诊重点。

接下来是笔试环节,团队用过去3年的中文执业医师资格考试测试ChatGPT,发现它能正确回答约72%的题目。这个分数高于80%以上的中国应试医学生。

对于这样的成绩,吴承瀚的看法是惊讶,令他惊讶的原因不在于人工智能通过了医师执照考试这件事,而是以英语为主要训练语言的ChatGPT,并不是针对任何考试而训练出来的专业模型,同样能通过中国考试。从最后的结果看,ChatGPT在知识类和逻辑类的题型上得分率接近,换句话说,当它被针对性训练后,得分会更高。

通过了中美两国的执业医师考试意味着什么?

“当时ChatGPT通过的是美国相当具有挑战性的三大专业考试,除了美国医学执业考试(USMLE),还有律师资格证考试和沃顿商学院MBA考试。”浙大二院脑科中心主任、浙江大学脑医学研究所所长张建民教授认为,“在ChatGPT高分值的背后,还有各种复杂因素。”

临床上诊治疾病,医生一方面需要遵循诊疗规范,但另一方面还必须针对每个个体的具体情况,也就是个性化原则。因为每个病人的社会背景、家庭背景、传统习惯和经济条件及个人意愿等不同,面对同样的疾病,医生还需要考虑众多现实因素,才能做出带有个性化的人文关怀的治疗决策。有时病人对这些信息的流露只是透过一个细微表情,甚至只是交谈中叹了口气,“这些小动作都有可能会影响医生的治疗决策,但显然AI医生感知不了。”

尽管目前越来越多的研究表明,ChatGPT在医疗方面的合理概率越来越高,但它依然存在回答不合理的概率,这对严肃且关乎生命的医学领域可能就会造成不良的结果。

所以,在惊叹学霸ChatGPT惊人学习能力的同时,张建民认为,真正要让人工智能在医院得到全面运用,还有不少路要走。

医生会因此失业吗?

“人工智能没法取代医生,但一定能更好地帮助医生,特别是提高地方医疗水平。”吴承瀚给出的答案很笃定。

原因很简单,医疗环节中,需要“人”的参与作为闭环。

吴承瀚提到:“比如让经验丰富的科室主任参加执业医师考试,也未必能拿到满分,但他们在平时的医疗工作中,出错率可能不到万分之一。”在他看来,考试分数和医疗技术水平并不能画上等号,这中间的差距,是因为医疗团队中更多的“人”在起作用。

那么,轻松考过执业医师执照的人工智能,将怎么帮助医生和病人呢?

就在本周,上海交通大学医学院附属瑞金医院展示了“未来医院”建设的最新成果,包括大模型赋能的AI健康咨询、“云上瑞金”智慧服务、全流程管控的智慧运营平台,让人看到了“人工智能+医疗”更强大的功能,和未来看病的各种可能。

“三年前浙大二院与浙江大学脑机接口团队合作完成了国内第一例植入式脑机接口临床研究,最后就是利用步进为0.1毫米的手术机器人,将4毫米×4毫米大小的阵列电极成功植入张大伯大脑皮层神经元的第4-5层。”张建民说,“人工智能在医疗领域已经得到应用,包括我们现在经常看到的手术机器人。人工智能表现出的超人记忆力、算法和精准性,不断赋能医疗健康领域。”

未来,虽然ChatGPT不一定会替代医生来对病人进行诊治,但未来的医疗,一定会是人机协同的医疗。

这点也得到了最早研究AI医生的公司之一谷歌的回应。7月12日,Google和DeepMind的科研人员在《自然》杂志上发表一项研究,表示大语言模型构建的AI医生在很多方面与人类医生相当,但这项技术不会威胁到全科医生的工作,未来可能更多用于医疗求助热线。

我们对人工智能医疗可以有怎样的期待?

希望人工智能在患者与医生沟通中成为桥梁,这也是吴承瀚团队开始这项研究的一个原因。

在温州市瓯海区的泽雅镇中心卫生院里,你可以看到这样的情景——年轻的全科医生卢鹏飞戴着一支AR眼镜,而从扩音器里发出的,是另一位更老成的男声。

卢鹏飞在通过AR眼镜连线上级医院专家为病人看病。

“我们的上级医院专家,可以通过这样的AR设备,清楚看到病人的情况,及时做出诊断。”卢鹏飞说。

在这科技感满满的场景中,并没有“人工智能”在起作用,不过在卢鹏飞看来,人工智能的发展能让这样的专家远程会诊成为更普遍的事情。

“我们不缺病人,但有时对疑难病例的诊断、用药有欠缺,通过AR眼镜连线专家是一种方式,人工智能对疑难病例的判断以及用药建议也是一种方式。”

基层医疗对人工智能的辅助作用翘首以盼,而在人类医疗高精尖的钻研上,人工智能也在发力中,特别是在医学影像识别、疾病诊断以及制药三个领域。

在美国,一家名为VideaHealth的牙科护理公司,其率先开拓了人工智能在牙科领域的应用。目前,美国90%的牙科诊所都可以使用这一平台辅助诊断。

此外,人工智能在疾病诊断方面也有着极为亮眼的表现。

在国际著名科学期刊《PLOSONE》上的一项研究指出,深度学习模型在阿尔茨海默氏症诊断中比未经训练的人工智能模型更加准确,而且该技术能够排除一些干扰诊断的因素,如年龄。

马萨诸塞州综合医院研究人员用数万张人脑扫描图像训练了一个深度学习模型,部分图像是患有阿尔兹海默氏症的患者大脑,部分没有,随后该研究将该模型与真实临床诊断数据进行了对比。

THE END
1.ChatGPT与接口测试chatgpt实现接口测试csdnChatGPT与接口测试 2024软件测试面试刷题,这个小程序(永久刷题),靠它快速找到工作了!(刷题APP的天花板)-CSDN博客文章浏览阅读1.3k次,点赞60次,收藏8次。你知不知道有这么一个软件测试面试的刷题小程序。里面包含了面试常问的软件测试基础题,web自动化测试、app自动化测试、接口测试、性能测试、自动化测试、安全https://blog.csdn.net/2301_76387166/article/details/134993585
2.如何使用chatGPT做谷歌SEO文章优化?这个工具是我之前在测试chatgpt内容的时候发现的,虽然是免费的但是和付费的做对比以后发现准确率还是很高的。如果想长期使用chatGPT产生内容的朋友,这个工具还是非常的推荐给你们的。 图片来源:zeroGPT截图 如果该工具发现有了AI写的内容会以黄色背景的形式显示出来,这种内容如果发布在谷歌网站或者社媒上的话就会被被检测https://www.cifnews.com/article/150840
3.如何搭建并部署ChatGPT接口服务如何搭建并部署ChatGPT接口服务 最近有不少朋友在问用于微信的ChatGPT接口以及怎么搭建ChatGPT接口服务,本文将以一个github开源项目为例,演示在Linux下搭建ChatGPT接口服务的流程。 一、准备工作 1、一台国外服务器(Linux环境) 国内的服务器目前无法访问ChatGPT的服务。https://www.deanhan.cn/create-chatgpt-api-for-wechat.html
4.用ChatGPT做软件测试dayuhome的技术博客本书以目前流行的大语言模型ChatGPT为基础,用丰富的案例演示ChatGPT在软件测试中的赋能作用。本书主要介绍如何用ChatGPT生成需求规格说明书、测试计划、功能测试用例、自动化测试用例、接口测试用例、测试数据和性能测试用例,以及ChatGPT在分析测试结果、辅助CI(Continuous Integration,持续集成)、生成测试总结报告和职业发展https://blog.51cto.com/u_13542393/12412401
5.对话ChatGPT一次产品视角的GPT功能测试(基于gpt3.5模型)Hello,大家好,作为一个又菜又爱玩的产品,OpenAI在厚积薄发后,其4.0的大语义模型通过了图灵测试,一时间国内产品圈和互联网圈“狼来了“的各种言论喧嚣直上。各种营销号也开始疯狂的贩卖焦虑,但是这个东西到底是一个颠覆生产关系的跨时代产品,还是一个营销的骗局呢?没有实践就没有发言权: https://www.imooc.com/article/334971
6.连玉君:我与ChatGPT聊了一个月说明:下面这段代码是这两天我刚写的,存放在我的本地电脑上。我没有通过邮件或微信跟任何人分享过这个代码。我想测试一下 ChatGPT 能否读懂这段代码,并帮我写个解读代码的说明文档 (类似于帮助文件或 readme 文档)。整体看来,它完成的不错。 5.1 ChatGPT 能读懂代码吗? https://lianxh.cn/news/4936433d8b2e9.html
7.检测ChatGPTGPT我用Bard、ChatGPT 和 HuggingChat 生成的内容测试了 Typeset,它准确地检测到了所有内容。 5. Hive Moderation 网址: https:///ai-generated-content-detection Hive Moderation 的 AI 生成内容检测偶尔会将人类生成的内容误认为是 AI。为确保可靠的结果,建议在将其用作主要资源时使用备份工具。AI 生成内容检测提供http://www.360doc.com/content/23/0619/22/1085405986_1085405986.shtml
8.在手机上轻松使用ChatGPT:一站式教程·构建你的智能应用,使用蓝集成ChatGPT API:获取OpenAI的API密钥并将其集成到你的应用程序中。确保API调用的安全性,在服务器端处理关键数据。 用户界面设计:根据用户需求设计简洁、高效的用户界面。考虑到移动设备的特点,尽量减少用户输入步骤,提高交互效率。 测试与部署:开发完成后,需要进行全面的测试,确保在不同型号的手机上都能正常运行。最后https://docs.lanyingim.com/news/easy-use-chatgpt-mobile-39-20240713-2-11-1720868646.html
9.校验ChatGPT4真实性的三个经典问题:快速区分GPT3.5与GPT4,并提现在已经有很多 ChatGPT 的套壳网站,以下分享验明 GPT-4 真身的三个经典问题,帮助你快速区分套壳网站背后到底用的是 GPT-3.5 还是 GPT-4。 大家可以在这个网站测试:https://ai.hxkj.vip,免登录可以问三条,登录之后无限制。咱们使用免登录的额度测试就已经够用了 https://www.cnblogs.com/hashtang/p/17784620.html
10.ChatGPT聊天体验本篇整理一下近几天与ChatGPT对话的记录,在理解人类语言这个层面上(AI语言模型都是概率论统计学基础上的模型,所以它的理解主要是统计学意义上理解,而不是感知和推理上的理解),的确达到了相当高的水平,自然流畅对话不在话下,当然也远不是无所不能,还是有一些不足与局限。我们讨论了与ChatGPT相关的一系列https://www.jianshu.com/p/51fa9082494f