试验设计:证据来自一项随机对照试验
内部效度:高。
一致性:不适用(N/A)——目前只有一项随机试验。
外部效度:正常。
害处:
有确切证据显示,98%(不是所有)的低剂量螺旋CT扫描筛查阳性的参与者最终没有被诊断为肺癌。假阳性可能导致不必要的侵入性检查。
效果量级:高
一致性:高。
筛查无益的证据
应用胸部X线和/或痰细胞学检查进行肺癌筛查
有确切证据表明,在总人群或有吸烟史的人群中,应用胸部X线和/或痰细胞学检查并不能降低肺癌致死率。
效果量级:N/A
试验设计:几项随机对照试验
外部效度:高。
假阳性检查结果
有确切证据显示,95%(不是所有)的胸部X线筛查阳性的患者最终没有被诊断为肺癌。。假阳性可能导致不必要的侵入性检查。
过度诊断
有确切证据显示,有少量但所占比率不可忽略的患者因胸部X线和/或痰细胞学检查出肺癌,最终被证明为过度诊断;这个群体所占比重大约在5%到25%。肺癌诊断导致了不必要的检查和不必要的治疗。而这些过度检查和治疗所带来的害处多发生于长期和/或大量吸烟者,其原因在于吸烟合并其他疾病会使患癌风险增加。
效果量级:在5%到25%之间,具体取决于筛查人群和筛查方案的不同
背景
发病率和死亡率
肺癌是美国第三常见的非皮肤癌症,且在男性和女性中的癌症致死率均居首位。仅2016年,据估计将有117,920名男性和106,470名女性诊断为肺癌,且这一年中将会有85,920名男性和72,160名女性因肺癌死亡。近几十年,肺癌在男性和女性中的死亡率快速增长,但男性的肺癌死亡率从1991年开始出现了持续下降。从2008至2012年,男性的肺癌死亡率每年降低3.0%,女性每年降低1.9%。
危险因素
低剂量螺旋CT筛查
经过大量的努力,肺癌筛查因新技术的出现已经得到了提升,包括低剂量螺旋计算机断层扫描(LDCT)。研究证明LDCT比胸片更敏感。在早期肺癌行动项目(ELCAP)中发现,LDCT检测到的I期肺癌是胸片的近6倍之多,这些肿瘤大多数直径都没有超过1厘米。
一项系统分析总结了1993年到2004年之间进行的13个针对LDCT的观察性研究,分别涉及了60至5,201名参与者。除了一些日本研究囊括了非吸烟者,其他研究都仅限于目前或曾经吸烟的烟民。检测到结节的比例从3%到51%不等,其差异可能归因于以下几个因素:
结节的定义(一些研究需要对结节大小进行限制)
CT技术的不同(扫描层厚越薄就能检测到更多、更小的结节)
地方性肉芽肿疾病的地理差异
总之,有1.1%到4.7%接受筛查的参与者被诊断为肺癌;他们中大部分为早期。
在LDCT组,649名筛查阳性的参与者最终被诊断为肺癌,筛查阴性的肺癌确诊者有44名,367名参与者错过了筛查或在筛查阶段结束后才被确诊为肺癌。而在X线放射组中,279筛查阳性的参与者最终被诊断为肺癌,筛查阴性的肺癌确诊者有137名,525名参与者在错过了筛查或在筛查阶段结束后才被确诊为肺癌。LDCT组的肺癌死亡人数为356人,而X线放射组为443人,前者较后者降低20%(95%置信区间[CI],6.8-26.7)。一项新的分析显示肺癌致死率降低约16%(95%置信区间,5–25)。总体而言,死亡率降低6.7%(95%置信区间,1.2-13.6)。每320人接受LDCT筛查,就能防止1人死于肺癌。
随着NLST结果的公布,越来越多的人了解到,哪些人群可以充分利用LDCT筛查肺癌并从中获益。一组研究者开发了一种个体风险模型来评估哪些人可能从筛查中受益。模型中加入了NLST中未列入纳入标准的额外因素,例如慢性阻塞性肺疾病、个人或家族性肺癌史、以及更详细的吸烟史。若用此标准来代替NLST的纳入标准,就可以有更多的人进行筛查来防止癌症的遗漏。另一组研究者对NLST的数据进行了重新分析,并计算出每个患者患肺癌的风险,以及他们的肺癌致死率。基于计算出的风险值,研究人员将NLST参与者分为五组。在低风险组,每5,276人接受筛查能避免1人死于肺癌。;而在高风险组,每161名参与者接受筛查能避免1人死于肺癌。此外,筛查结果假阳性的人数在五组中的最低风险组为1648名,而最高风险组为65名。风险最高的三个组的病死率因筛查降低了88%,而最低风险组病死率降低了1%。这些研究表明了哪些人群最可能从筛选中最大程度地获益,并能潜在地减少假阳性的数量,并在评估过程中同时减少潜在的不良反应事件发生。计算个体风险的另一个好处是可以将结果最终合并为一个公开的决策过程,使患者可以决定是否接受肺癌筛查。
其他有关LDCT的随机临床试验(RCT)正在一些国家进行。其中最大的是在荷兰和比利时进行的随机肺癌筛查试验(又称NELSON试验)。这项研究与NLST的不同之处在于对照组没有胸片筛查。在欧洲还有一些较小的试验也在将LDCT和非筛查组进行对比。这些小规模试验并没有达到致死率的研究终点,但是当NELSON试验数据成熟后,研究者会努力将那些试验的结果与NELSON试验的数据相结合。研究者也可以评估这些研究结果和NLST结果的一致性。除了从正在进行的试验中收集数据,研究者还会分析NLST的数据以评估有关肺癌筛查的一些其他方面的重要问题,例如成本效益、生活质量以及筛查对比NLST参与者年轻的人群和吸烟史低于30包年的人群是否有益。来自美国的前列腺、肺、结直肠和卵巢(PLCO)癌症筛查试验数据表明,在没有筛查的情况下,与吸烟史大于等于30包年和戒烟短于15年的人群相比,吸烟史在20~29包年的烟民在肺癌死亡风险方面没有差异(危险比1.07;CI,0.75-1.5)。虽然前吸烟者群体的风险与未戒烟者(美国预防服务工作组推荐该人群接受LDCT筛查)没有区别,筛查对于前吸烟者的作用仍是未知的。
筛查和戒烟
与普通人群相比,肺癌筛查的目标人群包含了许多患病率较高的当前吸烟者。肺癌筛查计划可能会影响人们戒烟的动力,理论上会促进筛查发现肺部异常的人群进行戒烟。相反,筛查也可能使没有发现肺部异常的参与者停止戒烟。丹麦肺癌筛查试验是一项随机试验,它比较了LDCT和不进行干预对于5070岁有至少20包年吸烟史的参与者的区别。研究者在5年的随访期内监测发现,每年两组中戒烟的参与者所占的比例从实验开始时(CT组和对照组各有23%的戒烟者)到5年随访期结束时(两组均有43%的戒烟者)几乎完全相同。这两个随机组的比较表明,CT筛查程序对戒烟的可能性的净影响接近于零。
另一份报告使用了NLST的数据以回答筛查结果是否影响戒烟的问题。NLST将CT与X光胸透进行了比较,研究者将两组数据汇总并评估了异常影像结果对戒烟动力的影响。与没有异常发现的参与者相比,筛查发现可疑肺癌(但不是肺癌)的吸烟者明显更倾向于一年后戒烟。若筛查发现肺部有大异常但不怀疑肺癌或小异常,那么发现异常和戒烟之间的联系则较弱且在统计学上不够明显。
这两项研究的结果表明,CT筛查程序对戒烟的的净影响很小——如果它存在的话,但对于发现可疑肺癌的吸烟者来说,戒烟的可能性有所提高。这个重要的研究领域的问题还有待阐明,特别是发现筛查程序有可能促进戒烟后,评估如何干预戒烟就显得更加重要起来。
X线和/或痰细胞学检查筛查
肺癌筛查的问题可以追溯到上世纪50年代,当时肺癌发病率和死亡率不断上升,人们不得不采取干预措施。为了应对新出现的肺癌问题,在上世纪50年代和60年代期间人们进行了五项胸部影像学研究,其中两项为对照研究;两项研究还包括了痰细胞学检查。这些研究结果表明筛查对整体没有益处,尽管由于研究设计的限制,这些结果很难得到确切的证据支持。
在上世纪70年代初期,美国国家癌症研究所资助了早期肺癌检测合作项目,旨在评估胸部X线及痰细胞学筛查在降低男性吸烟者肺癌死亡率方面的作用。该项目由三个独立的随机对照研究组成,每个试验都纳入了约10,000名45岁及以上的男性参与者,这些参与者在过去的一年每天至少抽一包香烟。其中一项研究在梅奥诊所进行,一项在约翰·霍普金斯大学,一项在纪念斯隆凯特琳进行。霍普金斯大学和纪念斯隆凯特琳的研究采用相同的设计:参与者被随机分配在两组,一组每4个月接受一次痰细胞学检查,并每年接受一次胸部X线影像学检查,而随机分配到对照组的参与者只接受每年一次的胸部X线影像学检查。研究均未观察到筛查使肺癌死亡率降低。这两项研究认为,在每年一次胸部X线检查的基础上加入频繁的痰细胞学检查没有益处。
梅奥诊所的研究(被称为梅奥肺计划,或MLP)的设计与上述不同。所有潜在的参与者都同时接受胸部影像学检查和痰细胞学检查,而已确诊或怀疑有肺癌以及身体状况差的对象被排除。留下的受试者被随机分配为两组:一组6年内每四个月接受一次胸部X线检查和痰细胞学检查,而对照组每年接受一次同样的两种检查。观察发现肺癌死亡率并没有因筛查增多而降低。这项20世纪70年代的MLP研究认为,高强度地同时进行X线胸片和痰细胞学检查的筛查方案并没有表现出任何益处。
在20世纪70年代,欧洲进行了一项有关肺癌筛查和胸部影像学的随机对照试验。该研究在捷克斯洛伐克进行,它纳入了6,364名40~64岁的男性吸烟者,这些受试者终生消费的香烟至少达到15万支,他们将接受肺癌的流行病学筛查(胸部X线检查和痰细胞学检查)。除了18名经检查被诊断为肺癌的患者外,其余所有的参与者被随机分配到以下两组之一:干预组将在3年内每半年接受一次筛查,而对照组仅在第三年接受筛查。研究发现,在干预组发生了19例肺癌死亡,而对照组为13例,并得出结论认为频繁的筛查是没有必要的。
至1990年,医学界仍然不确定胸部影像学筛查(使用传统的胸部X线)和肺癌致死率之间的关系。尽管以前的研究显示筛查没有任何益处,但由于统计功效不够,研究结果也并不确切。于是,一项有足够统计功效的多相试验——PLCO癌症筛查试验[376]于1992年开始进行,PLCO纳入了154,901名5574岁的参与者,其中包括妇女(50%)和不吸烟者(45%)。受试者一半被随机分配到筛查组,另一半则接受常规医学支持。PLCO的统计功效为90%,它检测到肺癌死亡率降低的概率为20%。
PLCO的肺计划讨论了与常规医学支持相比每年一次单相(后前位)X线胸片是否能够降低肺癌死亡率的问题。研究开始时,随机分配到筛查组的参与者会接受一次基本筛查和三个年度胸部X线筛查,虽然最终版本被改为对从不吸烟者只筛查三次。经过13年的随访期,干预组观察到1213例肺癌死亡,而常规支持组为1230例(死亡率的相对危险度,0.99;95%CI,0.87-1.22)。亚组分析认为,性别或吸烟状况对结果没有影响。
鉴于证据的充分度和一致性,以及在PLCO试验中观察到的益处的缺乏,我们可以得出结论,无论性别或吸烟状况如何,胸部X线和/或痰细胞学检查作为肺癌筛查不能降低肺癌的死亡率。
应用低剂量螺旋CT进行肺癌筛查
假阳性结果
在肺癌筛查的大背景下,假阳性检查结果是一个特别的问题。最有可能接受肺癌筛查的人群,即重度吸烟者,如果有合并症(如慢性阻塞性肺疾病和心脏疾病),可能不适合某些诊断性检查。
在前列腺、肺、结直肠和卵巢(PLCO)癌症筛查试验中,肺癌假阳性在所有阳性筛查结果中占98%。考虑到吸烟状况的影响,研究者发现假阳性筛查结果的百分比(在所有阳性筛查结果中)最高的是从不吸烟者(>99%),最低的是当前吸烟者(95%)。吸烟状况调整后,假阳性筛查结果的比例不存在性别差异。
G型(磨玻璃影)。
GS型(局灶玻璃样变,中心为实性结节)。
S型(实性结节)。
梅奥肺计划(MLP)的一项随访期约20年的队列研究表明,通过高强度胸部X线和痰细胞学检查诊断出的肺癌有17%为过度诊断;干预组共诊断出585例肺癌,而常规支持组则诊断出500例。PLCO的一项随访期13年的队列研究发现干预组共诊断出1,696例肺癌,而常规支持组则诊断出1,620例。这表明,每年一次胸片检查会导致约6%参与者被过度诊断为癌症,虽然这一比例与0%没有显著的统计学差异。
诊断性操作并发症
肺癌致死率增加
从MLP的研究结果可以看出,高强度的胸部X线和痰细胞学检查筛查方案有可能导致肺癌致死率增加。经过20年的随访期,最终得出的肺癌致死率在干预组为每1000例参与者有4.4人死亡,而常规支持组为3.9人。两组间没有统计学差异(P=0.09)。在约翰·霍普金斯大学和纪念斯隆-凯特琳进行的研究显示,干预组的致死风险没有增加(相对危险度[RR],0.88;95%置信区间[CI],0.74-1.05),而在PLCO也是同样的结果(RR,0.99;95%置信区间,0.87-1.22)。
放射线暴露
LDCT筛查的另一个潜在风险是放射线暴露。LDCT的平均暴露剂量是非常低的,为1.5mSv。据估计,经过3年的筛查,NLST参与者受到的平均辐射量为8mSv(包括筛查和检出结节后进行的其他辐射性影像学检查)。根据放射线暴露和患癌所建立的模型来看,对于加入如NLST的筛查项目的参与者,每2500次筛查就可能导致一例死亡,虽然筛查的好处(每320次筛查可避免1例死亡)远远超过它带来的风险。对于较年轻和那些没有明显肺癌风险的人群来说,筛查放射线暴露导致肺癌的风险可能要超过避免死于肺癌的筛查益处。