你能想象今后为你看病的,是一位人工智能机器人吗?
在科幻电影里并不少见的情景,似乎有越来越多成为现实的可能性了——上个月,浙江大学医学院附属第二医院神经外科吴承瀚团队在《数字医疗》期刊发表了一篇论文,他们用ChatGPT通过了中文执业医师执照考试。
继今年2月ChatGPT通过了美国执业医师考试之后,这位诞生不过半年多的生成式AI用中文通过了这场含金量很高的资格证书国考。
那么问题来了,在各个领域都大展身手的生成式AI,会取代医生吗?
“随便一考”就高分过关
先来看一看ChatGPT是怎么通过中文执业医师执照考试的。
执业医师执照考试分两部分,实践技能考试和笔试。
在实践技能考试环节,吴承瀚团队将10道病史采集题目发给ChatGPT,并请了两位医学生共同作答,最终将三位不署名的答案交给3位医生评审打分。
“这部分满分15分,ChatGPT拿到11分,不算高,但已经通过了。”吴承瀚说,团队发现ChatGPT能够详细覆盖所有临床问诊的内容,并抓住问诊重点。
接下来是笔试环节,团队用过去3年的中文执业医师资格考试测试ChatGPT,发现它能正确回答约72%的题目。这个分数高于80%以上的中国应试医学生。
对于这样的成绩,吴承瀚的看法是惊讶,令他惊讶的原因不在于人工智能通过了医师执照考试这件事,而是以英语为主要训练语言的ChatGPT,并不是针对任何考试而训练出来的专业模型,同样能通过中国考试。从最后的结果看,ChatGPT在知识类和逻辑类的题型上得分率接近,换句话说,当它被针对性训练后,得分会更高。
通过了中美两国的执业医师考试意味着什么?
“当时ChatGPT通过的是美国相当具有挑战性的三大专业考试,除了美国医学执业考试(USMLE),还有律师资格证考试和沃顿商学院MBA考试。”浙大二院脑科中心主任、浙江大学脑医学研究所所长张建民教授认为,“在ChatGPT高分值的背后,还有各种复杂因素。”
临床上诊治疾病,医生一方面需要遵循诊疗规范,但另一方面还必须针对每个个体的具体情况,也就是个性化原则。因为每个病人的社会背景、家庭背景、传统习惯和经济条件及个人意愿等不同,面对同样的疾病,医生还需要考虑众多现实因素,才能做出带有个性化的人文关怀的治疗决策。有时病人对这些信息的流露只是透过一个细微表情,甚至只是交谈中叹了口气,“这些小动作都有可能会影响医生的治疗决策,但显然AI医生感知不了。”
尽管目前越来越多的研究表明,ChatGPT在医疗方面的合理概率越来越高,但它依然存在回答不合理的概率,这对严肃且关乎生命的医学领域可能就会造成不良的结果。
所以,在惊叹学霸ChatGPT惊人学习能力的同时,张建民认为,真正要让人工智能在医院得到全面运用,还有不少路要走。
医生会因此失业吗?
“人工智能没法取代医生,但一定能更好地帮助医生,特别是提高地方医疗水平。”吴承瀚给出的答案很笃定。
原因很简单,医疗环节中,需要“人”的参与作为闭环。
吴承瀚提到:“比如让经验丰富的科室主任参加执业医师考试,也未必能拿到满分,但他们在平时的医疗工作中,出错率可能不到万分之一。”在他看来,考试分数和医疗技术水平并不能画上等号,这中间的差距,是因为医疗团队中更多的“人”在起作用。
那么,轻松考过执业医师执照的人工智能,将怎么帮助医生和病人呢?
就在本周,上海交通大学医学院附属瑞金医院展示了“未来医院”建设的最新成果,包括大模型赋能的AI健康咨询、“云上瑞金”智慧服务、全流程管控的智慧运营平台,让人看到了“人工智能+医疗”更强大的功能,和未来看病的各种可能。
“三年前浙大二院与浙江大学脑机接口团队合作完成了国内第一例植入式脑机接口临床研究,最后就是利用步进为0.1毫米的手术机器人,将4毫米×4毫米大小的阵列电极成功植入张大伯大脑皮层神经元的第4-5层。”张建民说,“人工智能在医疗领域已经得到应用,包括我们现在经常看到的手术机器人。人工智能表现出的超人记忆力、算法和精准性,不断赋能医疗健康领域。”
未来,虽然ChatGPT不一定会替代医生来对病人进行诊治,但未来的医疗,一定会是人机协同的医疗。
这点也得到了最早研究AI医生的公司之一谷歌的回应。7月12日,Google和DeepMind的科研人员在《自然》杂志上发表一项研究,表示大语言模型构建的AI医生在很多方面与人类医生相当,但这项技术不会威胁到全科医生的工作,未来可能更多用于医疗求助热线。
我们对人工智能医疗可以有怎样的期待?
希望人工智能在患者与医生沟通中成为桥梁,这也是吴承瀚团队开始这项研究的一个原因。
在温州市瓯海区的泽雅镇中心卫生院里,你可以看到这样的情景——年轻的全科医生卢鹏飞戴着一支AR眼镜,而从扩音器里发出的,是另一位更老成的男声。
卢鹏飞在通过AR眼镜连线上级医院专家为病人看病。
“我们的上级医院专家,可以通过这样的AR设备,清楚看到病人的情况,及时做出诊断。”卢鹏飞说。
在这科技感满满的场景中,并没有“人工智能”在起作用,不过在卢鹏飞看来,人工智能的发展能让这样的专家远程会诊成为更普遍的事情。
“我们不缺病人,但有时对疑难病例的诊断、用药有欠缺,通过AR眼镜连线专家是一种方式,人工智能对疑难病例的判断以及用药建议也是一种方式。”
基层医疗对人工智能的辅助作用翘首以盼,而在人类医疗高精尖的钻研上,人工智能也在发力中,特别是在医学影像识别、疾病诊断以及制药三个领域。
在美国,一家名为VideaHealth的牙科护理公司,其率先开拓了人工智能在牙科领域的应用。目前,美国90%的牙科诊所都可以使用这一平台辅助诊断。
此外,人工智能在疾病诊断方面也有着极为亮眼的表现。
在国际著名科学期刊《PLOSONE》上的一项研究指出,深度学习模型在阿尔茨海默氏症诊断中比未经训练的人工智能模型更加准确,而且该技术能够排除一些干扰诊断的因素,如年龄。
马萨诸塞州综合医院研究人员用数万张人脑扫描图像训练了一个深度学习模型,部分图像是患有阿尔兹海默氏症的患者大脑,部分没有,随后该研究将该模型与真实临床诊断数据进行了对比。