ChatGPT在临床试验中的应用探索康德弘翼WuXiClinical

随着OpenAI推出的人工智能系统ChatGPT的持续火爆,各行各业的人们都在讨论ChatGPT。作为ChatGPT早期使用者之一,我们将结合临床试验中的工作场景,从以下三个方面了解ChatGPT的潜力和能力边界。

一、ChatGPT是什么?

二、ChatGPT在临床试验中的应用案例。

三、ChatGPT的局限性。

一、ChatGPT是什么

ChatGPT由Chat+GPT组成,Chat指会话,GPT是“GenerativePre-trainedTransformer”的首字母,译为“生成式预训练模型”。它是一种基于深度学习的自然语言处理模型。我们可以将ChatGPT想象成一个会说话的图书馆,里面存储了海量的知识。当我们用人类的自然语言向它提问时,它能够“理解”我们的问题,迅速从这些知识中找到合适的答案,并生成连贯的语言回复我们。

在我们使用ChatGPT之前,它已经通过大规模无标签数据进行了预训练,掌握了丰富的知识。这也是它为什么能快速响应我们的提问的原因。

二、ChatGPT在临床试验中的应用案例

在正式开始案例之前,需要先简单了解一下打开ChatGPT大门的金钥匙——提示词(Prompt)。

提示词(Prompt)指在自然语言生成任务中,提供给模型的一个短语或语句。它的作用是给模型提供背景信息,引导和指示模型生成符合我们预期的回复。

提示词的好坏,直接关系到回复结果的质量。很多时候,我们发现模型的回复总是泛泛而谈,都是因为提问没有提供必要的背景信息,任务描述不够明确具体造成的。

接下来我们举两个临床试验中使用ChatGPT的例子。

案例一:数据一致性核查

在这个例子中,我们让ChatGPT用Python代码实现两个文件的一致性核查,我们向ChatGPT提出下面的问题:

最终ChatGPT给出了如下代码和注释,代码生成是ChatGPT的强项,我们只需要稍加修改就可以使用了。

案例二:CDASH变量标准化

第二个案例要复杂一些,我们将探索ChatGPT对不同数据格式上下文的理解能力,以及通过举例推理的能力,也就是少样本提示(FewShotPrompting)。

在建立eCRF时,我们通常要按照CDASH标准命名字段变量,但在实际工作中,由于对数据标准的理解、个人经验、不同治疗领域等原因,字段变量的命名常常会出现不符合CDASH标准的情况。

我们是否可以借助ChatGPT来实现变量命名的自动化审核呢?让我们做个实验。

实验的思路是:将CDASHModel中的观察类输入到ChatGPT中,然后给出CDASHIG中某个Domain的CRF中的问题,让ChatGPT根据CDASHModel给出这些问题的变量名。

具体步骤是,第一步,选取CDASHModel的发现类(FindingsClass),将发现类的CDASHIGVariable,DRAFTCDASHIGDefinition和QuestionText输入给ChatGPT(见下图),由于ChatGPT无法输入表格,所以这三列数据我以“|”做了分隔。

第二步,将CDSASHIG中的DA域的QuestionText输入给ChatGPT,让它给出每一个QuestionText对应的符合CDASH标准的变量名,为了让ChatGPT理解我们的任务要求,在这一步我们给ChatGPT举了一个任务的例子。

这些变量名在CDASHIG中已经给出,我们的目的是检验ChatGPT能否理解我们给出的CDASHModel,并正确推理出不同问题的变量名。

下图是ChatGPT给出的结果:

从实验结果来看,DATEST、DADTC、DALBLID都是错误的,RES和ORRES也没有区分开,实验结果并不理想。

那么,是不是意味着ChatGPT在专业邻域没有用武之地呢?

答案是否定的。之所以实验结果不理想,原因有以下几个方面?

2.通过ChatGPT官网的对话界面输入的CDASHModel数据量有限,导致模型不足以推理出正确的结果;

3.作为通用模型,ChatGPT在垂直领域没有经过微调,准确度较低;

了解了原因后,我们就可以“对症下药”,在垂直领域,我们可以借助OpenAI的API将垂直领域的知识“外挂”到大语言模型中,这样一来,可以补充大模型中缺少的数据,二来,通过API微调,可以生成更适合于专业领域的模型,从而提高准确率。

三、ChatGPT的局限性

尽管ChatGPT模型在知识的广度和深度方面已经远超人类,并具有较强的推理能力,但它仍然存在以下三个局限性:

第一,可靠性。由于ChatGP基于概率推算生成内容,无法保证回复内容的准确可靠。其回复可能包含未经验证的信息、误导性陈述以及逻辑错误,因此用户需要对其回复进行判断和验证。

第三,合规性。默认情况下,在ChatGPT官网输入的内容(非API),OpenAI可以用来训练ChatGPT,对于隐私数据和保密性有要求的内容存在数据泄露的风险。

作为通用大语言模型的ChatGPT,在其推出的短短数月内,便在广泛的应用场景中展现出了强大的潜力。相信在未来,随着研究的不断深入,以ChatGPT为代表的人工智能技术在临床试验领域会有更出色的表现。

作者简介

白欣刚

现就职于药明康德全资子公司康德弘翼。在计算机和生命科学领域有十几年的跨领域工作经验。在临床试验数字化系统解决方案上有深入的研究和实践经验。长期在行业内媒体普及电子数据采集系统和各种临床试验数字化系统。

THE END
1.边界AI边界AI 适用于 Android / IOS 设备 数十个大模型 · AI绘画 · PPT生成 · 写作助手 · AI数字人·AI音乐· 2000+AI模型·知识库 Chatgpt官方邀请你下载一起使用 安装 https://app.1foo.com/install/10CFE6
2.边界AI当你学会用Chat4.0来办公之后,你会发现整个世界好像都不一样了,好像什么事都变得很简单。比如让GPT帮我们写一份工作日报或者周报,轻松生成。 比如让GPT帮我们检查代码,解决报错。 比如让GPT帮解决Excel公式问题。 还有各种问题都能得到解决,让我们的工作效率嘎嘎直升。但是了解过AI的小伙伴都知道GPT4.0官方售价20美元https://www.360doc.cn/article/86859_1124028292.html
3.边界AI边界AI平台 首页 AI对话 AI智能体 new AI应用 new AI绘画 AIGC检测 AIGC降重 AI视频 AI音乐 AI翻译 AI写作 AI功能 AI模型 近期热门功能 AI联网搜索 AI文档 AI语音 AI视频处理 AI论文边界AI平台 数十个大模型 · AI绘画 · PPT生成 · 写作助手 · 30+AI插件 · 2000+AI模型https://ai1foo.com/download
4.ChatGPT是否可以进行文本边界检测?文本边界检测是自然语言处理中非常重要的一项任务。准确地确定每个单词的边界可以帮助我们更好地理解和处理文本,同时也可以提高后续处理和分析的效率。ChatGPT作为一种基于Transformer的模型,具有自注意力机制和序列建模的优势,可以有效地进行文本边界检测。 一、ChatGPT的文本边界检测原理https://www.gaodun.com/xinzhiye/1438899.html
5.别再错用ChatGPT了,这才是ChatGPT的正确打开方式!如果你告诉 ChatGPT 你希望增加客户线索,它可能会特别针对你的业务需求,提供一些定制化的策略和建议,例如如何利用社交媒体广告或优化内容营销,从而帮助你更容易地获取潜在客户信息。 设定边界 你可以通过设定一些参数来引导 ChatGPT 的输出。这可以帮助它更好地理解你的需求,并过滤掉不相关的信息。 https://blog.csdn.net/m0_59235245/article/details/141902919
6.黄仁勋对谈OpenAI联合创始人:如何为ChatGPT设定边界?黄仁勋好奇OpenAI应该如何为ChatGPT设置边界,使其足够安全。Ilya Sutskever说,现在AI语言模型还会产生幻想,犯下人类不会犯的错误,必须通过更多研究才能加强可靠性,也就是当ChatGPT收到压根没听过的知识时能够问清楚不确定的地方,并且不会回复它所不知道的答案,“这是当前遇到的瓶颈。” https://finance.eastmoney.com/a/202303232670642424.html
7.ChatGPT和科研的边界究竟在哪?Nature的大佬们有自己的看法ChatGPT和科研的边界究竟在哪?Nature的大佬们有自己的看法 和绘画工作者对生成式AI极端抵触的情绪不同,科研界其实一直对ChatGPT抱有乐观的态度,甚至它已经成为了许多学者的数字助手。计算生物学家Casey Greene用ChatGPT来修改论文,他直言AI用5分钟就能审查完一份手稿,费用也很低,只要0.5美元。http://www.embarkchina.org/74942
8.GPT具体而言,研究人员让其回答关于物体可供性的问题:「下列哪些物体可以拿(或其他动作)」,然后随即列举一系列物体,如苹果、盘子、床等等。ChatGPT就会返回一些物体的名称作为回答。 通过对数据的统计与分析,研究人员发现,ChatGPT-4展现出了类似人类的行为,显示出一个可供性边界的存在。 https://wallstreetcn.com/articles/3688694
9.这就是ChatGPT全本书评在线阅读1.揭开AI聊天机器人的神秘面纱:计算科学家斯蒂芬·沃尔弗拉姆亲笔撰写,为读者揭示OpenAI开发的人工智能聊天机器人程序ChatGPT的内部机制。 2.从原理到应用,探索人工智能的边界:探讨ChatGPT如何以令人惊叹的方式生成具有意义的文本。通过深入了解其先进的神经网络技术,读者将对聊天机器人和人类思维之间的关系有更深刻的认识http://e.dangdang.com/products/1901341069.html
10.ChatGPTChatGPT 面对多样化的问题对答如流,已经打破了机器和人类沟通的边界,这一工作的背后是大型语言模型 (Large Language Model,LLM) 生成领域的新训练范式RLHF (Reinforcement Learning from Human Feedback) ,即依据人类反馈的强化学习方法模型。 OpenAI官网上如是说:我们使用依据人类反馈的强化学习方法模型(RLHF)来实施https://www.jianshu.com/p/805abc3dcaae
11.怎么给chatgpt定人设?Worktile社区5. 定义ChatGPT的能力范围:ChatGPT应该有一个明确的能力范围,以免回答不了用户的问题或者提供错误的信息。你可以确定ChatGPT的专长领域和知识边界,让用户了解它可以提供什么样的帮助和答案。 总之,给ChatGPT定人设需要考虑它的身份、特质、个性、语言风格、外观和能力范围等因素。这样做可以使ChatGPT更贴近用户,提供更https://worktile.com/kb/ask/576864.html
12.chatgpt无法登录了导读:为帮助您更深入了解chatgpt无法登录了,小编撰写了chatgpt无法登录了,chatgpt无法登录,chatgpt无法登陆,chatgpt登录,chatgpt登录不了等5个相关主题的内容,以期从不同的视角,不同的观点深入阐释chatgpt无法登录了,希望能对您提供帮助。 本文目录一览 http://chatgpt.kuyin.cn/article/3337214.html
13.ChatGPT将带来多大技术革命新浪潮?此案当时成为版权法案中的一个先例——它涉及到一个作者可以在多大程度上借鉴别人的创造成果这一尚没有明确法律边界的问题。抄袭别人的几个句子是抄袭,那么借用别人的故事架构或创意又该如何评判呢?如今,随着ChatGPT的问世和应用,关于何谓“抄袭”的定义愈加引发人们的关注。由于机器人撰稿的本质是基于大数据的https://www.sast.gov.cn/content.html?id=kjb226386
14.张萌朱鸿军知识暗流的合规实践:ChatGPT在学术出版中的应用与这说明ChatGPT与真实作者的创作边界已不是那么清晰可辨,学术审稿人很难完全准确识别出ChatGPT生产的内容。ChatGPT并没有产生新的知识,而是对已有内容进行归纳与重组,生成了新的部落知识,知识只是发生了形式的迁移,并没有实质的增量。对于个体来说,往往更关注技术带来的直接利益,而非更下游的影响,所以有学者认为学术http://xinwen.cssn.cn/sy_50320/zdtj/zxxsgd/202307/t20230718_5668926.shtml