BMJ综述:肺癌的低剂量CT筛查
在世界范围内,是造成肿瘤死亡的主要病因之一,有数据显示,每年死于的越有160万人。在过去的四十年中,通过临床干预对降低肺癌的死亡率的作用极为有限。最近的研究结果指出,在吸烟的高危人群中,采用低剂量的CT进行筛查能降低患者死于肺癌的概率(约降低20%),因此提示在高危人群中可采用上述筛查方法来改善他们的预后。在世界范围内,很多临床机构和公共卫生机构都实施了针对肺癌的筛查测试。
有效的实施肺癌的筛查项目是复杂并具有争议的,它需要临床医师、研究者、公共卫生专家和公众的投入。最近主要的进展包括采用肺癌风险评估工具来确定需要进行筛查的高危人群,以及针对进行普通CT检查后所发现的肺部可疑结节或不确定肺部结节采用肿瘤风险计算器来指导临床处理方案。
本综述首先描述了目前对于采用低剂量CT筛查肺癌的理解和共识,也阐明了在肺癌筛查中所存在的相关的不确定性和未来科学的发展。本文还着眼于其他综述中所没有阐明的与筛查相关的一些关键问题,包括筛查所针对的人群以及如何处理在筛查时所发现的肺部结节。
流行病学
在2012年,约有180万的肺癌患者,占所有新发肿瘤患者的13%,死于肺癌的患者约有160万,占所有肿瘤死亡患者的20%。据预测,到2030年,在高收入国家中肺癌将成为排名第三的死亡原因,在中等收入国家为排名第五的死亡原因。
肺癌死亡率的时间和空间的变化趋势反映了人群的吸烟行为。在20世纪的大部分时间肺癌的发病率在不断增加。之后,在20世纪80年代的早期在美国男性中出现了肺癌发病率的降低,在1999年时,美国女性中也出现了肺癌发病率的降低,而在其他的一些欠发达国家,吸烟率和肺癌的发病率仍然在不断增加。
绝大部分的肺癌患者在疾病晚期才得到确诊,因此即使在发展中国家肺癌的生存率也很低,其5年生存率在18%及以下。如果患者在肺癌的早起就得到确诊,那么其预后大大改善,5年生存率在70%以上。这意味着采用低剂量的CT检查在早期发现病变能降低肺癌患者的死亡率。
肺癌筛查
最近针对肺癌筛查很多研究者都撰写了综述。在本文中,作者仅讨论了在既往所发表的综述中没有阐明的关键问题。自从20世纪50年代起,数个肺癌筛查研究都应用了胸部影像学检查(结合或不结合其他方法)。
但是这些研究由于都存在研究方法上的不足而受到诟病,并且这些研究的结果并不尽如人意。PLCO研究是第一个设计和实施都很好的大型随即对照研究,该研究评价了每年进行胸部影像学检查的效果。该研究结果提示胸部影像学筛查并不能降低肺癌的死亡率。
在过去的20多年中,随着影像学技术所取得的快速进步,应用不超过1.5 mSv的剂量的CT就能发现1mm的结节。随着这项技术的发展和成熟,低剂量CT筛查有望减少肺癌的死亡率(在减少放射剂量暴露的情况下早期发现病变)。
ELCAP研究的结果提示在早期就能检测到肺癌的存在,从而可以延长患者的生存期。之后,首个具有足够权重且设计实施良好的随机对照研究(NLST研究)评估了这些筛查项目在降低肺癌死亡率上的效果。该研究发现每年在年龄段位55-74岁的高危人群,以及在戒烟时间在15年以内的既往吸烟者中进行筛查能降低肺癌的死亡率达20%。这是目前为止我们所能找到的采用低剂量CT进行肺癌筛查的最确切的结果。
在欧洲还有一些小型的随机对照研究已完成或正在进行中,包括DANTE研究、MILD研究、DLCST研究、NELSON研究、ITALUNG研究、Depiscan研究、LUSI研究和UKLS研究。
对这些在欧洲进行的肺部筛查研究的试验设计进行了回顾。至今为止,DANTE研究、MILD研究和DLCST研究已经发表了中期结果,结果并没有提示CT筛查存在保护作用,这可能是因为研究的样本量较小,或是由于随机化不充分、定位不确定、入组时受试者人口特征不同、随访时间不同或随访时间相对较短所引起的。
NELSON研究是继NLST研究之后的第二大研究,该研究结果将在2015年发表。我们希望该研究的结果能定量确定低剂量CT筛查的效果。当筛查者的入组是基于精确的风险分层所进行时,那么筛查的效果可能更好。
最有效的筛查是在高危人群中所进行的,且筛查的频率为每年一次。此外,NLST研究的亚组分析提示在女性中进行筛查更为有效(在男性和女性中总体死亡率的相对风险为0.92和0.73)。
在NELSON研究设计之初时,上述的这些联系还不为人知。与NLST研究相比,NELSON研究所纳入的受试者(筛查组)较少,为7557人,而前者为26314人,并且NELSON研究所纳入的男性受试者比例更高,为84%,而前者为59%。此外,NELSON研究中,受试者吸烟的量也较少,并且在第二次至第三次筛查、第三次至第四次筛查的间隔时间分别为2年和2.5年,
因此,该研究所具有的有效权重较低,并且研究的设计也欠佳,因而验证筛查方法有效性的效力较弱。
欧洲所进行的研究中,即使将这些研究的结果相结合来判断,恐怕也不具有足够的统计学效能来改变NLST研究的结论。
在NLST研究的结果披露之后,数个组织推荐在高危人群中采用低剂量CT肺部CT检查作为筛查方法。建议进行筛查的组织如下:
美国胸外科协会、美国肿瘤协会、美国临床肿瘤协会、美国肺脏协会、安大略湖肿瘤护理协会、国家综合肿瘤网络、法国肿瘤组织和USPSTF。
这些推荐中的绝大部分是根据NLST研究的标准来确定高危人群的,如年龄介于55岁至74岁,吸烟史为30包年或以上(或者戒烟15年以内)、或一些来自于NLST的其他标准。作为筛查研究,这种关于风险的定义是具有实用意义的。然而,在选择筛查患者的范围时却显得不那么有用。因为,这些标准将连续的变量一分为二,因此就会出现信息的丢失。很多有价值的预测因子都被省略了,非线性的关系也被忽略了。
最近,USPSTF发表了一些针对肺癌的低剂量CT筛查的建议:对年龄在55岁至80岁之间吸烟量为30包年或以上(或戒烟少于15年)的人群建议每年进行筛查。USPSTF的一些结论来自于CISNET的微观模拟模型(该模型来自于5个模型的总结)。
CISNET模型发现与每两年或每三年进行一次筛查相比,每年进行筛查最为有效,并且筛查年龄范围延伸至80岁。
在过去的5年终,很多机构都开始开展肺癌CT筛查项目,其他的一些机构正在计划开展这一筛查项目。截止至2014年2月可以开展这一筛查项目的美国机构列于下表。
筛查的缺点
与美国普通人群相比,在NLST研究所纳入的受试者人群更健康,并且他们的受教育程度也更高。因此,CT筛查在美国普通人群中的开展情况可能不如NLST研究中。考虑到上述情况,延长筛查的时间可能效果更佳,或许降低的死亡率能超过20%。多个筛查指南强调只有在具有多学科协作的中心才适合开展筛查项目,只有这类机构才能给受试者提供完善的随访服务。
假阳性
假阳性结果一方面会给受试者带来心理压力,另一方面还会造成不必要的花费、对放射线的暴露、活检,乃至于手术,这会给受试者带来疼痛、残疾,在极端情况下,甚至于会出现死亡。因此,降低假阳性结果是极为重要的,在初始筛查中假阳性率在20%及以上,在后续的筛查中为3%及以上,该结果提示筛查对肺癌检出的敏感性仍处于较高水平。
心理压力
一些研究结果提示肺癌筛查后假阳性结果会给受试者带来痛苦,或降低受试者健康相关的生活质量。此外,还存在其他一些无法察及的微小的心理影响的存在。
过度诊断
过度诊断指的是所发现的肿瘤即使不经治疗,也不会产生显著临床症状或导致死亡。这些情况在一些开展筛查的肿瘤中是比较常见的,如和。过度诊断会导致假阳性结果的出现。在针对肺癌开展的CT筛查项目中是否会存在过度诊断的情况目前还不甚明了。
文献综述结果几乎没有发现肺癌过度诊断的案例的存在,因此,该综述的结果指出在肺癌筛查的过度诊断几乎都出现在原位腺癌(支气管肺泡腺癌)中,其在肺CT上表现为非实体结节。
为了减少过度诊断的发生,Grannis建议在建议受试者进行活检或手术切除治疗之前,必须首先观察到非实体结节向部分实体结节或实体结节转变或进展。
虽然很多单纯的非实体结节的转变极为缓慢,最近的一项研究回顾性的分析了对非实体结节的切除和病理诊断,表明在单纯的非实体结节中,12%为浸润性腺癌,另有16%为微浸润腺癌。该研究提示,对于进展的评判标准需要更为清晰的定义和进一步的研究。
基于CISNET模型,USPSTF预计肺癌的过度诊断介于10%至12%。NLST对过度诊断的分析指出,与胸部放射检查七年随访相比,每年三次筛查所带来的过度诊断率为19%(95%可信区间16%至23%),而与胸部放射检查持续终身的随访相比,每年三次筛查所带来的过度诊断率为9%。
另一个研究则采用体积倍增时间来评价过度诊断的情况。结果提示,在筛查中所发现的肺部肿瘤中,有25%的肿瘤生长缓慢或为惰性,因此,其中很大一部分肿瘤是被过度诊断的。
所以,我们需要进一步的研究来帮助我们认识过度诊断,以及估计过度诊断的程度。例如,我们需要区分和认识在过度诊断中,惰性肿瘤和不引起死亡的肺部肿瘤所起到的作用,以及它们是如何随着年龄的增长而发生变化的。
过量放射线的暴露
据估计,在接受筛查的2500例受试者中,其中出现的一例死亡或许是由于三次低剂量CT筛查以及其他相关的诊断性影像学检查所带来的放射线所导致的。
在2011年美国医学物理学家协会的一份声明中提出了对立的观点,即“在短时间内,对于单次检查而言,有效的放射剂量低于50 mSv,对于多次检查而言,有效的放射剂量低于100 mSv,这些剂量低到难以检测的程度,可视为不存在”。
然而,这一观点可能低估了反复进行的筛查所带来的影响,尤其是那些每年接受一次筛查直至74岁或80岁的受试群体。
有一个研究针对年龄在15岁以下的儿童进行了评估,结果提示潜在危害的存在,结果提示进行CT检查的话,每接受1 mGy的放射剂量,的相关风险增加0.036,脑肿瘤的风险增加0.023,结果具有显著统计学意义。
随着技术的进步,采用新一代的双来源CT肺癌筛查的剂量可降至0.1 mSv。然而,我们需要针对放射线暴露有害效果的研究,在世界范围内有数个针对成人影像学诊断的大型队列研究正在进行之中。
Harris和其同事对筛查所带来的有害影响进行了文献回顾,并将有害影响进行分类(尤其在肺癌筛查所带来的有害影响方面)。他们总结道做出进行筛查的决定通常取决于筛查所带来的获益,而筛查所带来的相关危害的信息却很少,即使有这样的信息,它们所占的权重也很低。
成本效益
既往对筛查的成本效益进行了评价,即针对肺癌的CT筛查的获益是否多于危害,以及进行筛查给社会和医疗系统所带来的花费是否在可承受的范围内。这些研究的研究方法、观点、假设、数据来源、结局、亚组分析和结果各不相同。
关于成本效益分析的结果跨度很广, 低的结果为一次基线筛查所节省的增值成本效益比每生命年为$2500,高的结果则为在既往吸烟者中每生命质量调整年所需为$2 322 700。然而,这些研究基于的结果都不是基于现实中的RCT研究得到的。基于NLST结果所进行的成本效益分析所得到的结果是$67 000每调整后的生命年。
对泛加拿大肺癌早期检测研究的前期分析提示对健康服务提供者而言,肺癌筛查项目的成本并不是很高。这是因为采用低剂量CT筛查出的肺癌患者大部分都是早期患者(I期和II期),因此这些患者都能进行手术切除治疗,治疗的成本比III期和IV期肺癌患者低了近一半。而采用酪氨酸激酶抑制剂等的靶向治疗的成本远高于化疗。此外,对于早期患者所采用的手术治疗通常是以治愈为目的,而对于晚期患者所采用化疗和靶向治疗通常只是姑息性治疗。
数个因素会对筛查项目的成本产生影响。筛查项目的成本与肺癌的风险、随访过程中所需要进行的CT和影像学检查的数量、诊断过程所带来的并发症和治疗方案相关。
在吸烟患者中的戒烟率也影响着筛查的成本效益。在普通人群中,年戒烟率在3-7%。在针对CT的观察性研究中,戒烟率在7-23%。在丹麦肺癌筛查研究中,戒烟率在CT筛查阳性和阴性的患者中分别为17.7%和11.9%。
在NLST的肺部筛查子研究中,筛查后的吸烟率和筛查结果的异常程度呈负相关。其他的研究则发现如果受试者通过CT筛查发现了异常的结果,那么这些受试者的戒烟率更高。这些结果提示肺癌筛查可以在吸烟者中降低吸烟率,从而减少死亡率。
采用准确的危险预测工具、优化肺部结节的处理方案、在筛查项目内整合有效的戒烟宣教,通过上述手段在高危人群中进行筛查,有助于改善肺癌筛查的成本效益。
预测肺癌的发生风险
对于高危患者而言,肺癌筛查的效果最为明显。为了确定这些受试者群体,改善肺癌风险预测模型(用于选择潜在的筛查对象),那么理解肺癌发生的高危因素是十分重要的。使用准确的风险预测模型,同时将年龄和吸烟史以外的危险因素结合考虑,那么这对于确定哪些受试者会发展为肺癌以及哪些患者会死于肺癌是十分重要的,根据上述情况,也能制定更为有效的筛查方案。
在对PLCO研究的受试者进行评估时,提示与NLST标准相比,采用Tammemagi 2012预测模型进行分析时,发现在后续6年的随访过程中,对肺癌诊断的敏感性增加了11.9%,结果具有显著统计学意义。同时,与NLST标准相比,其阳性预测值更高。
采用准确的风险预测模型来确定高危患者能改善筛查的成本效益,同时减少假阳性的筛查。肺癌高危国际研究组推荐要根据受试者的风险(是否为高危者)来确定是否进行肺癌筛查,为了达成这一目的,采用风险预测模型是有作用的。
为了有助于肺癌患者的筛查,预测模型需要具有较高的预测价值,而不是对疾病状态进行分类,也就是说对于预测模型而言,需要评价预测模型所得到的可能性与观察所得到的可能性之间是否匹配。通常应用受试者工作特征曲线下面积来评价模型的辨别效度。
特殊的风险预测模型
目前,至少有15个肺癌风险预测模型。这些模型适用的人群不同,对受试者的联系要求和临床信息也不同,适用的研究设计也各不相同。有一些模型仅针对特殊的受试者群体,仅能在该群体中应用。
Etzel模型仅适用于非裔美国人,Li和Park模型适用于中国人和韩国人。Maisonneuve发表了这两个模型的结果。第一个是将Bach模型用于意大利人群中,以此确定适合筛查的高危人群。第二个模型应用的是最初的筛查结果,因此不适用于在筛查之前进行判断。
Spitz扩展模型、Young、Hippisley-Cox、Li和Iyen-Omofoman模型使用生物标记、遗传学和临床信息(需要患者的联系方式、生物样本和测试结果)来进行筛查,或使用医学数据来进行筛查。因此,这些模型并不适用于自我报告类或不具备个人联系方式的样本群体。
Kovalchik模型是唯一一个采用NLST数据来评价肺癌死亡的模型。然而,NLST研究所选择的筛查对象是高危群体,因此该研究的样本仅代表了所有吸烟者中的40%。此外,在NLST所纳入的很多肺癌患者的随访时间还不够长,因此并不足以做出确定死亡率的判断。 因此,这一模型所反映出的仅为吸烟群体中50%以下肺癌死亡情况。
Cassidy和Spitz模型基于的是病例对照的数据,因此,并不能评价包括乃年龄和一些吸烟相关变量在内的重要变量。这些模型也不能很好的处理发病率相关的结果,而后者能很好的对危险因素进行估计,因此无法进行校正来适应于其他的情况。将这些模型和那些基于前瞻性数据(吸烟者中)的模型进行比较,辨别度仅为中等。
Bach模型的受试者为来自于Beta-Carotene和Retinol Efficacy Trial (CARET)研究中的高危吸烟者或暴露于石棉(或两者)的群体。Tammemagi 2011、2012 PLCO模型,以及EPIC模型的样本群体更大,不仅局限在肺癌高危群体,因此这些模型在吸烟者中具有较好的辨别性。
受试者群体和医疗体系
可以基于受试者群体或医疗体系来实施肺癌筛查项目,这将会确定如何评估潜在的筛查者的风险。基于人群的筛查可应用现有的模型,并且不需要直接和受试者进行接触,可以通过电话或网络进行评估。与基于医疗体系的筛查方法相比,这种筛查方法相对比较简单,适用范围广,耗时少。
基于医疗体系的筛查方法需要直接和患者进行接触。因此可以应用临床数据,以及用于风险预测模型中的生物标记。目前,还不存在生物标记可以帮助检测出早期肺癌的存在,或用于选择需要进行筛查的高危受试者。然而,在将来,可在气道表皮、痰、呼出的气体和血液中对特异性的生物标记进行评价。
基于医疗体系的筛查方法耗时更长,花费更高,但是其有效性也更佳。可将来自于临床评估、医疗记录和生物标记的信息进行整合从而制作出一个新的风险预测模型。
将风险预测的模型整合到肺癌筛查项目中尚存在一些问题。简述如下:如何来选择筛查对象从而将筛查的敏感性、特异性和成本效益最大化;是否需要根据既往的筛查结果、年龄增加和戒烟期的延长来修正风险因素。在明年,正在进行中的研究将会为我们提供进一步的信息来改善筛查者选择方面风险预测模型的应用。
对筛查所发现的肺部结节的处理
当在人群中实施CT筛查项目时其他需要考虑的问题包括:如何定义筛查阳性结果,以及对筛查所发现的肺部结节的合适的处理方案。由于既往没有影像学研究帮助确定所找到的肺部结节是否是新发的或它们的生物学特征行为,因此,第一轮的筛查带来了大量的对诊断研究的评估。
由于筛查后续所进行的检查不仅会对受试者造成伤害,也会增加成本,因此为了使后续的检查最小化,如重复的胸部影像学检查、活检甚至手术切除,随机对照研究、队列研究和指南都根据所检测到的结节的类型和大小来确定下一步诊疗方案。
在4mm到15mm之间,根据结节的不同大小,分为实质性结节、部分实质性结节和非实质性结节。在一些方案中将结节的直径作为判断依据,在另一些方案中则采用容积来判断。有一些指南则同时考虑结节的体积、结节的类型和在进行测试之前恶性的可能性。PET-CT在一些指南中是诊断试验中的一部分,但在另一些指南中则不是。
所有的RCT研究都对阳性的筛查结果做出了定义。如NELSON研究在内的一些研究对于筛查结果为阳性的受试者具有具体的诊断方案。在NLST研究中,对于筛查之后所需要作出的医疗决策则是留待相应的医生根据其临床实践和经验来做出。此外,NLST研究和NELSON研究所选择的研究资源类似,如在下一年筛查进行之前所需要重复进行影像学检查的次数、活检率或手术率、良性病变患者接受手术治疗的比例。
在第一年的筛查之后,就有新的影像学资料可以和入组时的影像学资料进行比较,以此判断是否有新发的结节,或者是既往存在的结节是否有进一步生长,但是在NELSON研究中重复进行影像学检查的比例较低。然而,进行肺活检的患者所占的比例在NELSON研究中略高,而确诊肺癌的患者比例在两个研究中相仿。
因此,在通过后续的筛查监测结节生长方面,虽然从理论上来说NELSON研究中所应用的容积测量和容积倍增时间比二维测量方法更为准确,但是在首次筛查时上述两种不同方案的资源利用相似。
I-ELCAP方案相应的结果如下,活检率为1.7%,手术率为1.3%,肺癌诊断率为1.3%,但是该研究中并未对重复胸部CT检查的频率、诊断性PET-CT频率和良性病变的活检或手术比例进行分析。根据在手术前通过活检所得到的肺癌确诊率,在良性病变中手术率约在6-43%。
在结节直径方面设定一个比较高的阈值从而减少患者所需要进行的后续检查的比例,但是在这种情况下,如果的确有病变存在的话,会导致要到下一个筛查周期时才有可能发现病变,从而延误对病变的治愈,因而需要在上述两种情况下进行权衡。
虽然小结节为肺癌的可能性比较低,但是也存在一定的可能性,比如在NLST研究中所确诊的肺癌有7%的直径为4-6mm,有13%为7-10mm。在后续的年度重复筛查中,有35%的肿瘤的直径在10mm或以下。
筛查的目的是为了在转移出现之前,早期检测和治疗肺部肿瘤。增加作为筛查结果阳性的结节的直径,可以增加肺癌筛查的特异性,但是却降低了筛查的敏感性。还没有研究对错误的结果所带来的危害进行评价。
在20%的患者中,肺部结节的体积虽大,但却不一定是恶性病变。因此,虽然在判断结节是否为恶性病变上,结节的体积和类型起到重要作用,但是仍需要有一个风险计算因子来综合判断受试者的个体特征和筛查发现的结节特征,从而能够快速的计算肺癌发病的风险。
外部验证
最近,有报道指出,在首次筛查时(无法对结节生长或密度变化作出判断的时候),存在一种外部验证的方法来指导临床决策。这种方法是泛加拿大预测模型和计算因子(http://www. brocku.ca/lung-cancer-risk-calculator),其能在不需要模型来分辨非实质性和部分实质性结节的情况下简化临床决策的制定。既往的肺部结节预测模型都是通过回顾性研究来确定的,是基于医院或诊所,基于肺癌高危人群所确定的。
当进行外部验证的时候,其他模型的准确性为中度。根据胸部影像学检查所检测到的肺部结节所建立的模型不适用于筛查过程,50%以上的肺癌为2cm及以下的结节,约有25%的肺部结节为非实质性或部分实质性,在胸部影像学检查上表现为几乎不可见。
对泛加拿大模型中无毛刺征(不规则边缘)的结节进行外部验证,AUC为0.97。将该模型用于直径在10mm或以下的结节中,或用于非实质性结节中,或用于非实质性联合部分实质性结节中,AUC分别为0.936、0.918和0.933。
在不同分界点泛加拿大模型预测的准确性不同。这些分界点能用于指导临床实践。比如,筛查中没有发现肺部结节或结节的危险评分小于1.5%的,其为肺癌的可能性低于0.7%(中位随访时间为4.7年)。
在NELSON研究中,在筛查没有发现肺部结节,或结节体积小于等于50mm3的受试者在5.5年之后罹患肺癌的风险为1%。在其他的研究中,也发现通过筛查如果没有发现结节或所发现的结节在3mm及以下,那么罹患肺癌的风险也很低。在这种罹患肺癌风险极低的人群中,就不需要每年进行筛查。可以通过结节风险评分、医生的评估和患者的意愿来确定需要活检或手术的标准(无论既往是否进行过重复低剂量CT检查或PET-CT检查)。
图1显示的是采用泛加拿大研究的原始数据所得到的肿瘤分期危险评分分布图。IA期的肿瘤的危险评分在10%或以上。风险评分在30%的PPV为40%。仅有1.14%的结节的风险评分在30%或以上。在其他的研究中,应用结节直径或容积范围所得到的异常筛查结果的PPV介于2.2%至36%。在NLST研究中,大于30mm的结节的PPV为41.3%。
在泛加拿大研究中,结节风险评分在30%及以上提示需要进行诊断性的活检;如果风险评分介于6-30%,那么需要在3个月内再进行一次筛查,从而寻找是否存在内部生长的证据,以决定是否需要进行活检。对恶性病变而言,PPV的下限为22.7,NPV为99.6。
如果受试者的风险评分介于1.5%至6%之间,那么他们只需要按规定的时间每年进行筛查即可。这一策略能显著降低筛查的成本,同时也能显著降低临床诊断性措施所造成的发病率和死亡率。
肿瘤容积
在首次筛查后所发现的结节,如果可以与既往所进行过的筛查结果进行比较,就能够判断该结节是否为新发结节,或如果是既往筛查已经存在的,那有没有出现体积和密度的变化,在进行这样的比较后,就能简化临床决策的制定。
对于在第二次筛查或后续筛查中所新发现的结节而言,处理的标准与首次筛查时所发现的结节一致(虽然在有些研究中的随访策略比较积极)——即缩短筛查的间隔时间。
对于既往就已经存在的结节而言,在进行容积分析时,如果容积增加超过25%,或是肿瘤容积倍增时间小于400天,那么则认为测试结果为阳性。如果是根据结节直径进行分析,最大直径至少增加1mm,或是增加了至少10%,那么认为检查结果为阳性。
在非实质性或半实质性结节中,如果出现了实质性的成分,或是实质性部分增加,那么则要怀疑恶变的可能(表2)。阳性结节者则需要进行进一步的临床诊断测试。
虽然在非球形的结节中,容积分析在理论上要比评估生长情况更准确,但是由于二维直径测量简单易行,所以是临床常用的评估方法。半自动化或全自动化的三维容积测量需要特殊的软件,以及测量的变量对于非实质性结节和半实质性结节而言太高,因此虽然该项技术的发展很快,但尚不常用。
人们对于肿瘤容积倍增时间常有误解。对于小结节通常不会安排活检,所以在出现浸润性病变之前,不可能通过容积倍增时间长而推断出浸润前病变(不典型腺瘤样增生和原位腺癌)的生长行为特征,而真实的肿瘤生长率则可以做到。在一个外科系列研究中,在需要进行手术切除的结节中有66%为不典型腺瘤样增生和原位腺癌。
在疾病发展的过程中,肿瘤容积倍增时间可以增加、减少或两者兼具。浸润前病变或浸润最小的病变的缓慢生长并不意味着它不可能转变为危及生命的肿瘤。此外,并不能前瞻性的、在个体水平确定对于何种肺部肿瘤是过度诊断的,因为我们并不知道如果不进行治疗的话怎样的受试者会死于肺部肿瘤。肺癌研究国际协会和其他的一些组织正根据现有的证据制定对不同肺部结节的处理方案。
筛查的频率
CISNET微观仿真模型对每年一次、两年一次和三年一次的筛查间期进行了评估,并且做出每年一次的筛查最为有效的结论。与之相对,一个小型的意大利队列RCT研究比较了每年一次和每两年一次的CT筛查,结果指出在这两种筛查方案间,肺癌的死亡率不存在显著差异。然而,该研究也发现与常规对照人群相比,筛查并不会减少肺癌所造成的死亡率,因此研究结果并没有提供强有力的证据支持进行两年一次的筛查。
需要进行进一步的研究来确定最佳的筛查频率。在低危受人群中(入组筛查没有发现结节或结节为肺癌的风险在1.5%及以下),或许并不需要每年都进行筛查。
筛查的维持时间
目前也没有确定筛查所应该持续的时间。在一项RCT研究中,最长的筛查维持时间为5年。每年进行一次筛查直至第25年,这样的筛查方案所带来的获益目前还无法得知。放射线所带来的潜在的危害,以及经由筛查所发现的结节并不是恶性病变——这样的情况所带来的潜在危害目前也不得而知。
目前的证据并不推荐在所有接受过首次筛查的受试者群体中进行每年一次的筛查直至80岁。比如,对于那些在首次筛查中结果为阴性(表3),或者重复筛查结果都为阴性,亦或是戒烟很久的受试者群体中,应该下调其肺癌发生的个体风险值。那些罹患肺癌风险很低的群体并不一定能从重复的筛查中获益。
如果将戒烟时间作为排除标准的话,筛查项目需要明确的是需要在既往吸烟的人群中逐渐停止筛查。然而,最近的分析则提示即使在退出筛查范围后的15年,仍然会出现发病风险增加的可能性。
对肺癌筛查项目的评估
系统性的肿瘤筛查比针对性的筛查更为有效,这一观点得到广泛的认同。因此需要对筛查项目进行质量评估。对于肺癌筛查而言,还没有确定这样的质量评估方式。需要包括是否存在这样一个分期,在此期中,与没有进行筛查的目标人群相比,筛查是否能降低肺癌的死亡率,以及筛查针对的人群是如何联系和参与到筛查项目中的。
未来展望
由于扫描图像包含200-400高分辨率的部分,所以对于低剂量CT的阅读和理解需要花费大量的时间 。为了观察到肺部所可能存在的结节,阅片时需要缓慢移动薄层。每次扫描阅片的时间需要花费约10分钟,这比阅读四张乳腺钼靶检查的结果更费时。
在NLST研究中,放射学家的平均假阳性率为28.7%(标准差为13.7%),假阳性率范围为3.8%至69.0%。对诊断性和筛查性的CT读片结果的质量评价是基于个体的。电脑软件工具可帮却确定结节是否存在,以及帮助确定是否需要另外一名胸部放射学家来重新阅片。如果这类软件在真阴性结果上具有较高的准确率的话,那么就可以用于处理大量的肺部筛查的影像学结果,从而降低成本。
应用血液或其他无创性获得的标本如呼出的气体对诊断性标记物进行评估,有助于确定毫米级结节的性质,或是有助于对筛查结果阴性的受试者进行判断。在肺癌筛查方面所取得的一个主要的进步是其能确定有哪些受试者可能出现侵袭性的肺癌。
具有应用潜力的判断肺癌发生风险的生物标记包括微RNA和表面活性蛋白B,但是还需要评价它们的增量值和花费。对结节和邻近肺组织、血管和气道的定量分析能为肿瘤发生风险提供有价值的信息。
也能通过应用环境和职业暴露信息,以及特异的生物标记也能增加对个体发生肺癌总体风险的预测的精确性。
结论
在高危吸烟者中开展低剂量CT对肺癌的筛查能降低肺癌的死亡率达20%。目前,还没有新的治疗方案能降低肺癌的死亡率至20%。肺癌风险预测工具的出现能确定罹患肺癌的高危受试者。此外,对肺部结节恶性风险的计算工具也能降低需要进行随访筛查的受试者人数,并将初次CT筛查就发现的可疑结节从20%降低至8%。
现有的数据支持筛查项目的实施,如果项目获得成功的话就能扩展项目的实施范围,从而改善肺癌患者的预后。