-
- 杨拴盈主任医师
-
医院:
西安交通大学第二附属医院
科室:
呼吸内科
- 胸部X线片对高危人群早期肺癌筛查价值的系统评价
- 作者:杨拴盈|发布时间:2011-10-29|浏览量:890次
蒋梅花 杨拴盈 明宗娟 李维 周丹菲 刘晓丽 戎彪学
西安交通大学医学院第二附属医院 西安 710004
通讯作者:杨拴盈 mobile:13991392919 email: yangshuanying66@163.com
【摘要】目的:应用Meta分析法综合评价胸部X线片(Chest X-ray)在肺癌筛查中的价值。方法:在PubMed、Cochrane、ISI Web of Knowledge等数据库检索1996年-2011年期间的相关文献资料;根据纳入标准筛选符合条件的文献;对文献进行信息统计、科学性评估及质量分级;采用随机效应模型进行数据分析;通过似然比(likelihood ratio, LR),汇总灵敏度和特异度(Pooled Sensitivity and Specificity)及汇总受试者工作特征曲线 (summary receiver operator characteristic curve,SROC曲线)等统计指标综合评价胸部X线片在肺癌筛查中的价值。结果:共纳入9篇文献,其中英文6篇,中文3篇,由8个独立研究构成,研究对象94490例。异质性检验提示无阈值效应,但存在其他原因导致的异质性,按随机效应模型进行Meta分析得出胸部X线片在肺癌筛查中价值的汇总阳性似然比为9.13,汇总阴性似然比为0.72,汇总灵敏度为0.25(0.219~0.282),汇总特异度为0.932(0.930~0.933),SROC曲线下面积(Area under curve, AUC)为0.8536。结论:胸部x线片对肺癌具有一定的诊断价值,但其敏感度为25%,不适用于筛查。西安交通大学医学院第二附属医院呼吸内科杨拴盈
关键词:胸部X线片,早期肺癌,meta分析,筛查
Role of chest x-ray in lung cancer screening: a Meta-analysis
【Abstract】 Objective: Using meta analysis to evaluate the value of Chest X-ray in screening for lung cancer. Methods: Searching the relevant documentation from PubMed, Cochrane ,ISI Web of Knowledge and other databases from 1996 to 2011; screening eligible literature according to the inclusive criteria; literatures were gathered as statistical information, assessed the quality of scientific and classified; using random effect model to analyze data; to evaluate the value of Chest X-ray in screening for lung cancer comprehensively by the likelihood ratio (LR), the pooled sensitivity, specificity and summary receiver operating characteristic curve (SROC curve) statistical indicators. Results: 9 literatures were collected including 6 in English and 3 in Chinese, with 8 independent researches and a total of 94490 cases were brought into the study. Heterogeneity was found except for threshold effect. A Meta-analysis was performed using the random effect model , and the value of the positive likelihood ratio was 9.13, negative likelihood ratio was 0.72, the weighted sensitivity was 0.25(0.219~0.282), the weighted specificity was 0.932(0.930~0.933) and SROC area under the curve (Area under curve, AUC) was 0.8536 by using Chest X-ray in screening lung cancer. Conclusion: chest X-ray has certain diagnosis value for lung cancer, but it does not apply to screening for lung cancer because the sensitivity is only 25%.
Key words: chest X-ray, early lung cancer, Meta Analysis, screening
肺癌是全球最常见的恶性肿瘤之一,近年来其发近病率和死亡率呈明显上升的趋势。2002年全球肺癌新增病例数约135万人,死亡人数约118万人[1],而2008年,全球肺癌新发病例达161万人,死亡病例达138万人[2],分别增加了19%和17%。根据我国肿瘤登记处的登记资料显示[3],我国1998-2002年肺癌新病例69 597 例, 死亡病例61 090 例,是威胁我国居民身体健康的主要恶性肿瘤。尽管肺癌的治疗手段日新月异,其5年生存率仍不到15%[4]。肺癌的预后与诊断时的临床分期密切相关[5],但目前大部分病人确诊时已到晚期,无法手术治疗,预后极差[6]。因此,寻找筛查早期肺癌的有效方法一直受到高度关注[5]。胸部x线片由于经济、射线量小、无创,是诊断肺癌的常用工具[7]。对于胸部x线片对肺癌是否具有筛查价值,多个医学中心对其进行了研究。然而,独立单位的研究往往存在一定程度的偏倚,为了对胸部x线片在肺癌筛查中的价值作出科学的评价,本文应用Meta分析法对其进行循证医学研究。
一、材料与方法
1.资料来源:从PubMed、Cochrane、Web of science、Medline、Springerlink、CNKI、万方等数据库检索发表年限为1996年1月至2011年2月的中英文文献。检索词主要包括:胸部X线片、早期肺癌、筛查、chest x-ray、early lung cancer or lung tumor、screening。对检索到的重要文献的参考文献进行二次检索。
2.纳入标准:(1)各文献采用的研究主题及方法基本一致。(2)语言限于中文和英文。(3)文献研究对象不是来自某一特定人群,且样本量>30例。(4)以病理学结果作为金标准,对无病理学结果者,需以随访1年以上而做出的临床诊断为标准。(5)文献能直接或间接的提供计算灵敏度、特异度、比值比(odds ratio, OR)等指标的数据。(6)具有详细的成像方法及质量保证的描述。(7)设计良好的前瞻性研究或回顾性研究, 随访严密 ,随访年限≥1年。(8)排除肺外恶性肿瘤的诊断。(9)明确诊断前未行干预治疗。
3.排除标准:(1)排除述评、综述、文摘及案例报道等文献材料。(2)分组混乱;不能提取间接相关数据;根据描述提取的间接数据计算所得灵敏度、特异度与文献所给不一致者。(3)临床资料描述不详细;无病理对照或以临床诊断为标准而随访不足1年者。(4)研究主题不符。(5)文献研究对象来自某一特定人群。
4.文献质量评价:文献的质量分级主要参照循证医学指南中的“证据分级水平及依据”,分为5个等级:A级:设计良好的随机对照试验;B级:设计较好的队列或病例对照研究;C级:病例报告或有缺点的临床试验;D 级:个人的临床试验;E级:没有足够的证据以形成一种意见。
5.敏感性分析:将纳入研究逐一排除后,对剩余研究进行meta分析,评价汇总灵敏度与特异度。结果变化不大,说明纳入文献的稳定性好;反之,入文献的稳定性差。
6.数据统计方法:(1)获取统计量:以胸部X线片首次筛查出的肺部非钙化结节中金标准判断为阳性者记录为真阳性(TP); 胸部X线片首次筛查出的肺部非钙化结节中金标准判断为阴性者记录为假阳性(FP);随访1年为止经金标准判断为阳性但胸部X线片判断为阴性者记录为假阴性(FN);随访1年为止经金标准判断为阴性且胸部X线片判断为阴性者记录为真阴性(TN),建立诊断试验四格表。用统计软件获得其诊断比值比(the diagnostic odds ratio, DOR)及其95%可信区间(95%CI)。对同一指标的多个不同试验进行 Meta 分析,根据OR值的权重,用受试者工作特征曲线表示,这条曲线称为汇总受试者工作特征曲线(summary receiver operator characteristic curve,SROC曲线)。为防止ROC曲线产生可察觉的偏倚而进行Cox校正,进而对DOR值行Logist转化,建立拟合直线方程,制作SROC曲线。(2)异质性检验:Meta 分析所用的统计方法根据纳入研究是否具有齐性分为固定效应模型统计方法和随机模型统计方法。而文献纳入的异质性[8]主要是由阈值效应和非阈值效应引起,本研究通过计算灵敏度对数和(1-特异度)对数的Spearman相关系数检验其阈值效应;通过DOR的Cochran-Q值来检验非阈值效应。若拒绝同质性假设,则选择随机效应模型;反之,则选择固定效应模型。
7.统计学处理:应用Meta-Disc1.4软件进行统计学分析并作图。
二、结果
1.检索结果:初步检索英文文献326篇,中文文献34篇。发表时间为1996年1月?2011年2月,经阅读摘要并排除重复文献、文摘、综述及个案等进一步筛选,然后详细阅读全文,用纳入及排除标准进行衡量,对检索到的重要文献的参考文献进行二次检索,最终共纳入文献9篇,其中英文6篇,中文3篇,分别由8个独立研究机构完成,均为前瞻性研究。纳入文献的详细信息和基本数据分别见表1和表2
表1 纳入文献的详细信息
作者 |
国家 |
样本量(人) |
年龄(岁) |
吸烟史 (包年) |
是否 高危人群 |
质量评分(级) |
|
|
Henschke等[9] |
美国 |
1000 |
≥60 |
≥10 |
是 |
B |
|
|
Gohagan等[10], [11] |
美国 |
1658 |
55~74 |
≥30 |
是 |
A |
|
|
Fujikawa等[12] |
日本 |
10796 |
≥40 |
不要求 |
否 |
B |
|
|
Infante等[13] |
意大利 |
2472 |
60~75 |
≥20 |
是 |
A |
|
|
Hocking等[14] |
美国 |
77464 |
55~74 |
不要求 |
否 |
A |
|
|
郑浈浈等[15] |
中国 |
280 |
≥45 |
不明确 |
是 |
D |
|
|
李 健等[16] |
中国 |
433 |
≥50 |
≥20 |
是 |
D |
|
|
殷瑞根等[17] |
中国 |
387 |
≥50 |
≥20 |
是 |
D |
|
|
表2 纳入文献的诊断试验参数信息
编号 |
作者 |
病例数 |
TP |
FP |
TN |
FN |
Sen(%) |
Spe(%) |
Acc(%) |
1 |
Henschke |
1000 |
7 |
61 |
912 |
20 |
26 |
94 |
92 |
2 |
Gohagan |
1658 |
7 |
145 |
1493 |
13 |
35 |
91 |
90 |
3 |
Fujikawa |
10796 |
11 |
303 |
10468 |
14 |
44 |
97 |
97 |
4 |
Infante |
2472 |
35 |
32 |
2349 |
59 |
37 |
99 |
96 |
5 |
Hocking |
77464 |
120 |
5845 |
71055 |
444 |
21 |
92 |
92 |
6 |
郑浈浈 |
280 |
2 |
18 |
258 |
2 |
50 |
93 |
93 |
7 |
李 健 |
433 |
4 |
6 |
415 |
8 |
33 |
99 |
97 |
8 |
殷瑞根 |
387 |
3 |
6 |
370 |
8 |
27 |
98 |
96 |
2.文献评价结果:为了尽可能避免偏倚,提高所纳入研究的合适性,两个研究者对所有被检索出的文献独立进行评估。从纳入的研究中提取资料也由两人独立进行。质量分级结果见表1。研究样本含量均较大,进行敏感性分析后表明纳入文献稳定性较好,可用于Meta分析。
3.数据分析:共入选文献9篇,纳入研究对象94490人,年龄在40岁以上。
(1) 异质性检验:本组研究结果显示灵敏度对数和(1-特异度)对数的Spearman相关系数=-0.143,P=0.736,P >0.05,表明不存在阈值效应。计算DOR值的Cochran-Q=107.46,df=7, P <0.05,表明存在非阈值效应,如图1。以上结果表明纳入文献存在异质性,考虑与纳入文献的人群、年龄等有关,故应采用随机模型进行meta分析。
注:红点表示具体数值,横线表示95%CI,箭头表示数据未显示区域。
图1 胸部x线片对肺癌诊断比值比的森林图
(2) Meta分析结果:因为文献所提供的资料具有异质性,所以采用随机效应模型。用DerSimonian-Laird统计方法计算合并DOR值、灵敏度和特异度,并计算其95%CI,作森林图。DORDL=13.27(4.79-36.76)(见图1)。汇总加权灵敏度和特异度经过样本的间接合并,得合并灵敏度=0.250(0.219~0.282),特异度=0.932(0.930~0.933)(见表3)。图2为其森林图,可以直观的看到各文献对于合并灵敏度与特异度的加权的大小。汇总加权的阳性似然比(+LR)=9.13、阴性似然比(-LR)=0.72,如图3所示。SROC曲线如图4,AUC为0.8536。
表3:Summary Sensitivity and Specificity
Study | Sen [95% Conf. Iterval.] Spe[95% Conf. Iterval.] ----------------------------------------------------------------------------------
Henschke | 0.259 0.111 - 0.463 0.937 0.920 - 0.952
Gohagan | 0.350 0.154 - 0.592 0.911 0.897 - 0.925
Fujikawa | 0.440 0.244 - 0.651 0.972 0.969 - 0.975 Infante | 0.372 0.275 - 0.478 0.987 0.981 - 0.991
Hocking | 0.213 0.180 - 0.249 0.924 0.926 - 0.922
郑浈浈 | 0.500 0.068 - 0.932 0.935 0.899 - 0.961
李 健 | 0.333 0.099 - 0.651 0.986 0.969 - 0.995
殷瑞根 | 0.273 0.060 - 0.610 0.984 0.966 - 0.994
--------------------------------------------------------------------------------------
Pooled | 0.250 0.219 - 0.282 0.932 0.930 - 0.933
--------------------------------------------------------------------------------------Heterogeneity chi-squared = 18.05 (d.f.= 7) p = 0.012
Inconsistency (I-square) = 61.2 %
注:图中红色圆点表示各独立研究,贯穿圆点的直线为95%可信区间。圆点越大,直线分布越窄,说明该研究的样本量越大,精度越大,在汇总时给予权重越大;反之,则该研究精度越小,权重也越小。红色菱形点为汇总后值。
图2 胸部x线片诊断肺癌的敏感度和特异度的森林图
注:PLR说明诊断试验正确判断为阳性的概率是错误判断为阳性的概率的倍数。比值比越大,该阳性为真阳性的概率越大。NLR越小,说明该试验结果为真阴性的可能性越大。
图3 胸部x线片诊断肺癌的阳性似然比和阴性似然比森林图
注:中间蓝线为SROC,其两侧的蓝线为95%可信区间。图中红点为8个纳入研究。圆点越大,说该研究的样本量越大,精度越大,在汇总时给予的权重越大;反之,该研究精度越小,给予的权重越小。
图4 胸部x线片诊断肺癌价值的受试者工作特征曲线
三、讨论
肺癌恶性程度高, 近年来发病率呈明显上升趋势。统计资料[18]显示肺癌的预后与诊断时的临床分期密切相关,0期患者术后的5年生存率可达90%以上,Ia期患者术后5年生存率为60%,而Ⅱ-Ⅳ期患者总的5年生存率则从40%下降到5%以下。因此肺癌的筛查具有重要的临床意义。胸部X线片是诊断肺癌的常用工具。对于胸部x线片对肺癌是否具有筛查价值,多个医学中心对其进行了研究。Okamoto等[19]对日本藤泽和平冢1983-1993年间死于肺癌的193例患者进行病例对照研究,对照组579例,与试验组进行了居住地、性别和出生年龄的匹配,结果显示应用胸部x线片进行肺癌筛查可使肺癌死亡率下降约46%。Nakayama 等[20]进行的病例对照研究也提示每年一次的胸部x线检查能使肺癌的死亡率下降20-30%。但始于1960年的北伦敦研究[21]不支持胸部x线筛查能降低肺癌死亡率这一观点,该研究纳入了55 034例40岁以上的伦敦男性,其中试验组29723例,每6个月接受一次CXR检查,共3年;对照组25311例,仅在3年初、末各进行一次CXR检查。结果显示:试验组诊断肺癌132例,3年中因肺癌死亡62例;对照组诊断肺癌96例,因肺癌死亡59例。试验组肺癌筛出率是对照组的1.16倍,对照组肺癌死亡率是试验组的1.03倍,差异均无统计学意义。Manser等[22]纳入了4项随机对照试验对胸部x线片肺癌筛查的意义进行meta分析。非频繁胸部x线片筛查组38635例,629例死于肺癌;频繁胸部x线片筛查组42668例,710例死于肺癌,RR=1.11(95%CI:1.00-1.23),即频繁筛查组肺癌死亡率反而高于非频繁筛查组。由美国国家癌症研究所(National Cancer Institute ,NCI)发起的“前列腺、肺、结直肠和卵巢癌筛查试验”是一项多中心、大样本、随机对照试验,可望明确胸部x线检查是否能降低肺癌死亡率,其最终结果预计在2015年公布[14]。
随着循证医学的发展,近年来Meta分析逐步引入我国临床医学研究领域,它是对目的相同、性质相近的多个独立研究结果进行系统、定量综合分析的一种研究方法[23],能从统计学角度达到增大样本含量、提高检验效能以及探讨多个研究间的异质性的目的,从而为临床实践及卫生决策提供综合可靠的证据,而不是依据个人经验。本研究应用meta分析方法将各研究中心关于胸部x线片筛查肺癌的研究综合分析,结果显示胸部x线片诊断肺癌的汇总灵敏度为25%(22%-28%),说明其漏诊率很高,为75%。这可能是因为胸部x线片图像前后重叠,密度分辨率低,同时纵隔、心脏、横隔、肋骨和肺血管等结构往往掩盖病变的征象,因此很难分辨较细微的正常和异常结构,使一些肺结节在诊断中被漏诊。汇总特异度为93%(93.0%-93.3%),提示其误诊率为7%。似然比属于同时反映灵敏度和特异度的复合指标,当PLR大于10且NLR小于0.1时,具有令人信服的诊断效力,当PLR大于5且NLR小于0.2时,具有较强的诊断效能[24],本研究汇总PLR为9.13(3.93-21.16),提示通过胸部x线片诊断肺癌,正确判断阳性的可能性是错误判断阳性的9.13倍。汇总NLR为0.72(0.62-0.83)提示胸部x线片错误判断阴性的机会是正确判断的72%,说明胸部x线片诊断价值有限。SROC曲线分析方法是基于meta分析的思想,采用灵敏度与(1-特异度)的logit变换后的回归分析,对多个研究的ROC曲线进行分析综合的方法,是一项反映诊断价值的最好的统计学方法[25]。AUC≈1.0是最理想的检测指标,AUC<0.5说明无诊断价值,0.5~0.7说明诊断准确性较低,0.7~0.9说明诊断准确性中等,大于0.9说明诊断价值较高。本研究AUC=0.8536,说明胸部x线片诊断肺癌的准确性中等。相比之下,低剂量螺旋对肺癌的筛查价值可能比胸部x线片更高[26],其敏感性是胸部x线片的4倍[27]。但与胸部x线相比,它也有假阳性率高、辐射量大及费用高的不足[27]。
本研究应用Meta-Disc软件进行异质性检验时发现Spearman相关系数=-0.143,P=0.736,P >0.05,表明不存在阈值效应,但 DOR值的Cochran-Q=107.46,df=7,P <0.05,提示各研究结果间存在非阈值效应,考虑异质性原因有:1.只纳入为英文和中文文献,存在一定的语言偏倚及发表偏倚[28];2.各研究机构所选用的设备(如传统x光机、计算机x线成像、直接数字化成像)及扫描参数(曝光时间、管电压、管电流)不统一;3.研究对象的年龄、性别、人种构成,吸烟指数不统一;4.阅片者不同,对影像结果的判断不同。
总之,本Meta分析提示:胸部x线片对肺癌诊断特异度为93%,说明其误诊率仅为7%,适用于对肺癌的诊断。SROC下曲线面积为0.8536,表明胸部x线片对肺癌具有一定的诊断价值。但其敏感度为25%,假阴性率很高,不适用于筛查。但各研究间异质性较大且研究项目较少,仍需相关临床研究来补充本Meta分析。
参考文献:
[1] Parkin DM, Bray F, Ferlay J, et al. Global Cancer Statistics, 2002 [J]. CA Cancer J Clin, 2005, 55 (2): 74-108
[2] Ferlay J, Shin HR, Bray F, et al. Estimates of worldwide burden of cancer in 2008: GLOBOCAN 2008 [J].Int J Cancer,2010,127(12):2893-2917
[3] 陈万青,张思维,李连弟,等。中国部分市县1998~2002 年肺癌的发病与死亡[J]。中国肿瘤,2006,15(9):570-574
[4] Blanchon T, Bréchot JM, Grenier PA, et al. Baseline results of the Depiscan study: A French randomized pilot trial of lung cancer screening comparing low dose CT scan (LDCT) and chest X-ray (CXR) [J]. Lung Cancer, 2007, 58 (1):50-58
[5] National Lung Screening Trial Research Team, Aberle DR, Adams AM, et al. Baseline Characteristics of Participants in the Randomized National Lung Screening Trial [J]. J Natl Cancer Inst, 2010, 102(23): 1771-1779
[6] Bach PB, Kelley MJ, Tate RC, et al. Screening for Lung Cancer: A Review of the Current Literature [J]. Chest, 2003, 123 ( 1 Suppl):72S-82S
[7] Pinsky PF, Freedman M, Kvale P, et al. Abnormalities on Chest Radiograph Reported in Subjects in a Cancer Screening Trial [J]. Chest, 2006, 130 (3):688-693
[8] 张天嵩,钟文昭。Meta-Disc软件在诊断实验Meta分析中的应用[J]。循证医学,2008,8(2):97-108
[9] Henschke CI. Early Lung Cancer Action Project: Overall Design and Findings from Baseline Screening [J]. Cancer, 2000, 89 (11 Suppl):2474-2482
[10] Gohagan J, Marcus P, Fagerstrom R, et al. Baseline Findings of a Randomized Feasibility Trial of Lung cancer Screening With Spiral CT Scan vs Chest Radiograph: The Lung Screening Study of the National Cancer Institute [J]. Chest, 2004,126 (1):114-121
[11] Gohagan JK, Marcus PM, Fagerstrom RM, et al. Final results of the Lung Screening Study, a randomized feasibility study of spiral CT versus chest X-ray screening for lung cancer [J]. Lung Cancer, 2005, 47(1): 9-15
[12] Fujikawa A, Takiguchi Y, Mizuno S, et al. Lung cancer screening--Comparison of computed tomography and X-ray [J]. Lung Cancer, 2008, 6(2): 195-201
[13] Infante M, Cavuto S, Lutman FR, et al. A Randomized Study of Lung Cancer Screening with Spiral Computed Tomography:Three-year Results from the DANTE Trial [J]. Am J Respir Crit Care Med, 2009,180 (5):445-453
[14] Hocking WG, Hu P, Oken MM, et al. Lung Cancer Screening in the Randomized Prostate, Lung, Colorectal, and Ovarian (PLCO) Cancer Screening Trial [J]. J Natl Cancer Inst, 2010,102 (10):722-731
[15] 郑浈浈,董琼雄,郑瑜,等。胸部DR与低剂量螺旋CT扫描在肺癌筛选中的应用价值[J]。中国CT和MRI杂志,2009, 7( 2 ):30-32
[16] 李健。数字胸片筛查肺癌433例分析[J]。苏州大学学报( 医学版) ,2010,30( 4):846-847
[17] 殷瑞根,刘东明,王冬青,等。数字胸片筛查肺癌的限度分析[J]。实用医学影像杂志,2005,6 (6):309-311
[18] Mountain CF.Revisions in the international system for staging lung cancer [J]. Chest, 1997,111 (6):1710-1711
[19] Okamoto N, Suzuki T, Hasegawa H, et al. Evaluation of a clinic based screening programme for lung cancer with a case-control design in Kanagawa, Japan [J]. Lung Cancer, 1999, 25 (2):77-85
[20] Nakayama T, Baba T, Suzuki T, et al. An evaluation of chest X-ray screening for lung cancer in gunma prefecture, Japan: a population-based case-control study [J]. Eur J Cancer, 2002, 38(10):1380-1387
[21] Brett GZ. The value of lung cancer detection by six-monthly chest radiographs [J]. Thorax 1968, 23(4):414-420
[22] Manser RL, Irving LB, Byrnes G, et al. Screening for lung cancer: a systematic review and meta-analysis of controlled trials [J]. Thorax, 2003, 58 (9):784-789
[23] 李幼平。循证医学[M]。北京,人民卫生出版社,2002:499-599
[24] Jacschke R, Guyart GH, Sackett DL, et al. Users"guides to the medical literature.III.How to use an artical about a diagnostic test.B. What are the results and will they help me in caring for my patients? The Evidence-Based Medicine Working Group [J]. JAMA, 1994, 271 (9): 703-707
[25] Zamora J,Abraira V,Muriel A,et al. Meta-DiSc: a software for meta-analysis of test accuracy data [J]. BMC Med Res Methodol, 2006, 6:31
[26] Sone S, Takashima S, Li F, et al. Mass screening for lung cancer with mobile spiral computed tomography scanner [J]. Lancet 1998, 351 (9111): 1242-1245
[27] U.S. Preventive Services Task Force. Lung Cancer Screening: Recommendation Statement [J]. Ann Intern Med, 2004,140 (9):738-739
[28]翟俊霞,王丹,牟振云,等。 Meta分析中的偏倚分析[J]。河北医药,2009,31(24):3413-3414