肿瘤荟萃分析的效应量选择、异质性处理、亚组分析策略与发表偏倚评估。适合肿瘤学研究生和临床研究者。
肿瘤学(oncology)是 Meta 分析应用最广泛的医学领域之一。根据 PubMed 数据,每年发表的肿瘤 Meta 分析超过 5000 篇,涵盖从化疗、靶向治疗到免疫治疗的各个方向。为什么肿瘤领域特别依赖 Meta 分析?
肿瘤临床试验面临几个固有挑战:
通过合并多项研究的数据,Meta 分析可以:
肿瘤领域的 PICO 框架需要比一般医学 Meta 分析更精确的定义,因为肿瘤类型、分期和治疗线数对结果影响巨大。
以"免疫检查点抑制剂联合化疗治疗晚期非小细胞肺癌"为例:
| PICO 元素 | 定义 | 关键考量 |
|---|---|---|
| P (Population) | IIIB/IV 期非小细胞肺癌(NSCLC)初治患者 | 需明确分期、治疗线数、是否排除驱动基因阳性(EGFR/ALK+) |
| I (Intervention) | PD-1/PD-L1 抑制剂 + 含铂双药化疗 | 需明确免疫药物种类、化疗方案是否限定 |
| C (Comparison) | 含铂双药化疗 ± 安慰剂 | 安慰剂对照 vs 开放标签需区分 |
| O (Outcome) | 主要终点:OS、PFS;次要终点:ORR、≥3 级不良事件 | 每个终点需独立分析,使用不同效应量 |
肿瘤 Meta 分析的检索需要覆盖以下数据库:
("carcinoma, non-small-cell lung"[MeSH] OR "NSCLC") AND ("immune checkpoint inhibitors"[MeSH] OR "pembrolizumab" OR "nivolumab" OR "atezolizumab") AND ("randomized controlled trial"[pt] OR "clinical trial, phase III"[pt])
MetaReview 内置 PubMed 检索功能,支持关键词搜索和文献类型筛选,可以直接在工具中完成文献检索和 AI 辅助筛选。
肿瘤 Meta 分析最大的特殊性在于结局指标的多样性。不同类型的结局需要使用不同的效应量,这是肿瘤 Meta 分析方法学的核心。
| 结局类型 | 常见指标 | 推荐效应量 | 说明 |
|---|---|---|---|
| 生存终点(时间-事件数据) | OS、PFS、DFS、RFS、EFS | HR (Hazard Ratio) | 考虑了时间维度和删失,是生存数据的标准效应量 |
| 二分类疗效终点 | ORR、DCR、pCR | OR (Odds Ratio) 或 RR (Risk Ratio) | 从事件数/总数计算,RR 更直观,OR 统计性质更好 |
| 二分类安全性终点 | ≥3 级不良事件、治疗相关死亡 | OR 或 RR | 与疗效终点相同,但需注意稀有事件的处理 |
| 连续变量 | QoL 评分、肿瘤标志物水平 | MD 或 SMD | 相同量表用 MD,不同量表用 SMD |
关于 OR 和 RR 的选择:在肿瘤 RCT 中,两者的差别通常不大。RR 的临床解读更直观("干预组的缓解率是对照组的 X 倍"),OR 在统计上更稳健(尤其是事件率极高或极低时)。审稿人对两者都接受,但需要在方法中说明选择理由。
详细的效应量选择指南请看:OR、RR、MD、SMD 怎么选?Meta 分析效应量完整指南
生存终点(OS、PFS)是肿瘤 Meta 分析最重要的结局指标。以下通过具体案例演示完整流程。
假设你要合并 5 项 RCT 的总生存期(OS)数据:
| 研究 | 方案 | HR | 95% CI | 事件数 |
|---|---|---|---|---|
| KEYNOTE-189 (2018) | Pembrolizumab + 化疗 | 0.49 | 0.38 - 0.64 | 213 |
| IMpower150 (2018) | Atezolizumab + 化疗 + 贝伐珠单抗 | 0.78 | 0.64 - 0.96 | 319 |
| CameL (2019) | Camrelizumab + 化疗 | 0.73 | 0.55 - 0.96 | 125 |
| ORIENT-11 (2020) | Sintilimab + 化疗 | 0.60 | 0.45 - 0.79 | 148 |
| RATIONALE-304 (2021) | Tislelizumab + 化疗 | 0.69 | 0.52 - 0.92 | 136 |
完整的 HR 提取和计算方法请看:生存数据 Meta 分析:HR 的提取、计算与解读指南
除了生存终点,肿瘤 Meta 分析经常需要分析客观缓解率(ORR)、疾病控制率(DCR)等二分类终点。这些指标反映的是治疗的短期疗效。
ORR 是二分类数据(缓解/未缓解),需要从每项研究中提取:
| 研究 | 干预组缓解/总数 | 对照组缓解/总数 |
|---|---|---|
| KEYNOTE-189 | 138/206 (67.0%) | 57/206 (27.7%) |
| IMpower150 | 171/336 (50.9%) | 100/317 (31.5%) |
| CameL | 85/205 (41.5%) | 43/207 (20.8%) |
| ORIENT-11 | 127/200 (63.5%) | 61/197 (31.0%) |
| RATIONALE-304 | 131/223 (58.7%) | 44/111 (39.6%) |
以 KEYNOTE-189 为例:
OR = 5.30 表示干预组缓解的几率是对照组的 5.30 倍;RR = 2.42 表示干预组缓解的概率是对照组的 2.42 倍。当事件率较高时(如 ORR > 30%),OR 和 RR 的数值差距会比较大。RR 更符合临床直觉,但 OR 的统计性质(如在 Logistic 回归中的良好数学特性)使其在学术论文中同样常用。
分析不良事件(如治疗相关死亡、5 级不良事件)时经常遇到稀有事件问题:
异质性(heterogeneity)是肿瘤 Meta 分析中最常见也最棘手的问题。由于肿瘤研究涉及不同癌种、分期、治疗方案和人群特征,I² 超过 50% 的情况非常普遍。
| 异质性来源 | 具体表现 | 对结果的影响 |
|---|---|---|
| 临床异质性 | 不同癌种(鳞状 vs 非鳞状)、不同分期(III 期 vs IV 期)、不同治疗线数(一线 vs 二线) | 直接影响治疗效应大小 |
| 治疗方案差异 | 不同免疫药物、不同化疗方案、不同联合策略 | 药物机制不同导致疗效差异 |
| 生物标志物差异 | PD-L1 表达水平、EGFR/ALK 突变状态、TMB、MSI 状态 | 生物标志物是疗效预测因子 |
| 人群差异 | 亚洲人群 vs 欧美人群、年龄分布、ECOG 评分 | 种族和体质可能影响药物代谢和疗效 |
| 方法学差异 | 开放标签 vs 双盲、是否允许交叉治疗、随访时间长短 | 影响效应量的估计精度 |
| 指标 | 含义 | 判断标准 |
|---|---|---|
| I² | 异质性占总变异的百分比 | 25% 低、50% 中、75% 高 |
| Q 检验 | 各研究效应量是否一致 | p < 0.10 提示存在异质性 |
| τ² | 研究间方差绝对值 | 越大异质性越强 |
| 预测区间 | 新研究效应量的预期范围 | 若跨越无效线,说明效应不稳定 |
亚组分析(subgroup analysis)是肿瘤 Meta 分析中最有临床价值的部分。它回答的是:"哪些患者从治疗中获益最大?"审稿人和临床医生最关注的往往就是亚组结果。
亚组分析必须在 PROSPERO 注册方案中预先指定,不能事后根据数据"挑"亚组。肿瘤 Meta 分析中最常见的预设亚组变量:
| 分组变量 | 分组方式 | 临床意义 |
|---|---|---|
| PD-L1 表达 | TPS ≥50% vs 1-49% vs <1%;CPS ≥10 vs <10 | 免疫治疗疗效的核心预测因子 |
| 组织学类型 | 鳞状 vs 非鳞状(肺癌);HER2 阳性 vs 阴性(乳腺癌) | 不同亚型对治疗反应不同 |
| 治疗线数 | 一线 vs 二线及以上 | 后线治疗效应通常较弱 |
| 地区 | 亚洲 vs 非亚洲 | 种族差异、EGFR 突变频率不同 |
| ECOG 评分 | 0 vs 1 vs ≥2 | 体力状态影响治疗耐受性 |
| 年龄 | <65 岁 vs ≥65 岁 | 老年患者的获益-风险平衡 |
| 脑转移状态 | 有 vs 无 | 脑转移患者预后差,药物透过血脑屏障能力不同 |
| 肝转移状态 | 有 vs 无 | 肝转移与免疫治疗疗效负相关 |
| 吸烟状态 | 吸烟者 vs 从不吸烟者(肺癌) | 吸烟者 TMB 更高,免疫治疗获益更大 |
在每个亚组内分别计算合并效应量后,需要进行亚组间差异检验(test for subgroup differences):
发表偏倚(publication bias)指阳性结果的研究更容易被发表,而阴性或无意义的结果可能留在"文件柜"里。在肿瘤领域,这个问题有其独特性。
| 方法 | 适用条件 | 解读 |
|---|---|---|
| 漏斗图(Funnel Plot) | 纳入研究 ≥10 篇 | 对称 = 无明显偏倚;不对称 = 可能存在偏倚 |
| Egger 检验 | 连续型效应量(HR、MD) | p < 0.10 提示存在小样本效应 |
| Begg 检验 | 通用 | 秩相关检验,统计效力较低 |
| Trim-and-fill 法 | 漏斗图不对称时 | 估计"缺失"研究的数量和对合并效应的影响 |
高质量的肿瘤 Meta 分析论文需要按照 PRISMA 2020 规范报告,并使用 GRADE 框架评估证据质量。
生存终点(HR):
疗效终点(OR):
GRADE 框架将证据质量分为四级:高、中、低、极低。RCT 的 Meta 分析起始为"高质量",以下因素会降级:
| 降级因素 | 肿瘤 Meta 分析中的常见情形 |
|---|---|
| 偏倚风险 | 开放标签试验(无法盲法)、高比例的交叉治疗 |
| 不一致性 | 不同癌种或不同药物间效应量差异大(I² > 50%) |
| 间接性 | 研究人群与目标人群不完全匹配(如排除了老年患者) |
| 不精确性 | 合并效应量的 CI 宽,样本量不足,OIS 未达到 |
| 发表偏倚 | 漏斗图不对称,Egger 检验 p < 0.10 |
详细的报告规范请看:PRISMA 2020 流程图:在线制作模板与填写指南
留下邮箱,第一时间获取新功能通知和 Meta 分析技巧。
我们不会发送垃圾邮件,随时可退订。
取决于结局指标类型。生存终点(OS、PFS、DFS)必须使用 Hazard Ratio (HR),因为 HR 考虑了时间维度和删失数据。二分类疗效终点(ORR、DCR)使用 OR 或 RR。连续变量(生活质量评分)使用 MD 或 SMD。不同类型的效应量不能在同一个 Meta 分析中混合合并。
绝对不可以。HR 来自 Cox 比例风险回归,衡量的是整个随访期间的瞬时事件发生率之比;OR 来自 Logistic 回归或四格表,衡量的是固定时间点的事件发生几率之比。两者的数学基础完全不同。如果部分研究报告 HR、部分报告 OR,应该分别进行独立的 Meta 分析。
通常偏高(I² > 50% 很常见),原因包括:不同癌种或亚型、不同分期、不同治疗线数、不同药物方案、不同生物标志物状态等。处理方法:使用随机效应模型、按预设变量亚组分析、Meta-regression、排除临床异质性过大的研究。如果 I² > 85% 且无法解释,建议改为叙述性综述。
几个特殊点:(1)PD-L1 表达是关键分层因素,需按不同阈值进行亚组分析;(2)免疫治疗的 KM 曲线常出现"拖尾效应",可能违反比例风险假设;(3)部分试验允许交叉治疗(crossover),会稀释 OS 差异;(4)联合方案(免疫+化疗、双免疫)增加临床异质性。
必检:PubMed/MEDLINE、Embase、Cochrane Library。强烈推荐:ClinicalTrials.gov、WHO ICTRP、ASCO 和 ESMO 会议摘要。涉及中国人群时还应检索中国知网(CNKI)和万方数据库。
不需要。MetaReview 是完全免费的在线 Meta 分析工具,支持 HR、OR、RR、MD、SMD 等所有常用效应量,自动生成森林图、漏斗图和敏感性分析。所有计算在浏览器内完成,无需安装软件或编写 R/Stata 代码。
会议摘要是肿瘤 Meta 分析的重要数据来源,但需注意:摘要数据可能是初步结果;同一试验有正式论文时以论文为准;仅有会议摘要的研究质量评估困难;建议在敏感性分析中排除仅有会议摘要的研究。方法部分需说明是否纳入会议摘要。