MetaReview

生存数据 Meta 分析:HR 的提取、计算与解读指南

从 Kaplan-Meier 曲线到 Forest Plot,手把手教你完成 Hazard Ratio Meta 分析。

什么是 HR Meta 分析

在医学研究中,许多临床结局都是"时间-事件"型数据:患者从治疗开始到疾病进展、死亡或其他终点事件发生的时间。这类数据被称为生存数据(survival data),分析方法统称为生存分析(survival analysis)

当多项研究都报告了同一干预对生存结局的影响时,我们需要用 Meta 分析将它们合并起来,得到一个更精确的总体估计。生存数据 Meta 分析的核心效应量是 Hazard Ratio(HR,风险比)

HR 的定义

HR 是两组之间瞬时事件发生率(hazard rate)的比值。它来自 Cox 比例风险回归模型,考虑了随访时间和删失(censoring)。HR = 0.70 意味着在任意时间点,干预组的事件发生速率是对照组的 70%,即干预降低了 30% 的风险。

什么时候需要 HR Meta 分析

HR vs RR:不要混淆

HR 和 RR 都叫"风险比",但它们完全不同:

特征HR(Hazard Ratio)RR(Risk Ratio)
数据来源Cox 比例风险回归 / 生存分析四格表 / 累积发病率
是否考虑时间是,考虑事件发生的时间点否,只看固定时间点的累积事件数
处理删失数据是,能正确处理失访和删失否,删失患者通常被排除或简单处理
无效值11
典型场景肿瘤 OS/PFS,心血管 MACERCT 中的二分类结局(治愈率、死亡率)
关键区别:HR 基于整个随访期间的事件率,RR 基于固定时间点的累积事件率。两者不能在同一个 Meta 分析中混用。如果你的纳入研究有的报告 HR、有的报告 RR,必须分开分析。

如何从论文中提取 HR 数据

提取 HR 数据是生存分析 Meta 分析中最关键也最容易出错的步骤。根据论文报告的完整程度,提取方式分为三种场景。

场景一:论文直接报告 HR + 95% CI(最常见、最简单)

这是最理想的情况。大多数高质量 RCT 和队列研究都会在文中或表格中直接报告 Cox 回归的 HR 及其 95% CI。

示例:论文报告 "HR = 0.72, 95% CI: 0.58-0.90"。你只需要记录这三个数字:

MetaReview 会自动完成后续的 log 变换和标准误计算。

提取位置优先级:正文结果部分 > Table(通常在 multivariable analysis 表中)> Figure 图注 > Supplementary material。如果多个模型都报告了 HR,优先选择调整后的(adjusted)HR,因为它控制了混杂因素。

场景二:论文报告 HR + p 值(无 CI)

有些较早期的论文或会议摘要只报告了 HR 和 p 值,没有 95% CI。此时可以通过 p 值反推标准误。

方法:

  1. 从 p 值查找对应的 z 值(例如 p = 0.05 对应 z = 1.96,p = 0.01 对应 z = 2.576)
  2. 计算 log(HR) 的标准误:SE = |log(HR)| / z
  3. 再反推 95% CI:CI = exp(log(HR) ± 1.96 × SE)
SE[log(HR)] = |log(HR)| / z
其中 z = 正态分布分位数,对应论文报告的 p 值

示例:论文报告 HR = 0.65, p = 0.003。

  1. p = 0.003(双侧)对应 z = 2.968
  2. log(0.65) = -0.431
  3. SE = |-0.431| / 2.968 = 0.145
  4. 95% CI = exp(-0.431 ± 1.96 × 0.145) = exp(-0.715, -0.147) = (0.489, 0.863)
注意:如果论文只报告 "p < 0.05" 这种模糊表述,直接用 z = 1.96 会高估标准误(低估精确度)。这是保守估计,可以接受但不理想。最好联系原作者获取精确数据。

场景三:论文只有 Kaplan-Meier 曲线(无 HR 报告)

这是最困难的情况。一些老文献或阴性结果的研究可能只展示了 KM 曲线,没有报告 HR。

此时需要使用 Tierney 等人(2007)的方法从 KM 曲线间接估算 HR。核心步骤:

  1. 使用数字化工具(如 WebPlotDigitizer)从 KM 曲线图上提取各时间点的生存概率坐标
  2. 结合论文中报告的各时间点风险人数(number at risk,通常在 KM 图下方)
  3. 根据提取的数据重建每个时间段的事件数和删失数
  4. 使用这些重建的 IPD(individual patient data)近似数据估算 HR

参考文献:Tierney JF, Stewart LA, Ghersi D, Burdett S, Sydes MR. Practical methods for incorporating summary time-to-event data into meta-analysis. Trials. 2007;8:16.

Tierney 方法有配套的 Excel 计算工具,可在论文附录中下载。如果 KM 曲线下方没有风险人数表,估算的精度会大幅降低。在纳入排除标准中,可以考虑将"无法提取 HR"作为排除理由。

数据提取表模板

建议使用以下标准化表格记录提取的数据:

提取字段说明示例
第一作者研究的第一作者姓名Wang
发表年份论文发表年份2023
研究设计RCT / 队列 / 其他RCT
干预组实验组的干预措施免疫治疗 + 化疗
对照组对照组的处理化疗
结局指标OS / PFS / DFS 等OS
HR风险比0.72
95% CI 下限置信区间下界0.58
95% CI 上限置信区间上界0.90
HR 类型调整 / 未调整Adjusted
数据来源直接报告 / p值推算 / KM提取直接报告

HR 的统计原理

理解 HR Meta 分析的统计基础,有助于正确执行分析和识别错误。核心要点是:HR 的合并不是在原始尺度上进行的,而是在 log 尺度上

为什么要做 log 变换

HR 的取值范围是 (0, +∞),分布是右偏的。例如 HR = 0.5(风险减半)和 HR = 2.0(风险翻倍)虽然效应大小相等但方向相反,在原始尺度上到无效值 1 的距离却不同(0.5 vs 1.0)。

经过 log 变换后:

log 变换:yi = log(HRi)

标准误的计算

已知 HR 和 95% CI 时,标准误的计算公式为:

SE[log(HR)] = (log(CIupper) - log(CIlower)) / 3.92

其中 3.92 = 2 × 1.96,因为 95% CI = log(HR) ± 1.96 × SE,所以 CI 宽度 = 2 × 1.96 × SE。

示例:HR = 0.72, 95% CI (0.58, 0.90)

  1. log(HR) = log(0.72) = -0.329
  2. log(0.90) = -0.105
  3. log(0.58) = -0.545
  4. SE = (-0.105 - (-0.545)) / 3.92 = 0.440 / 3.92 = 0.112

逆方差加权合并

Meta 分析使用逆方差加权法(inverse-variance method)在 log 尺度上合并各研究的 log(HR):

权重 wi = 1 / SEi²

合并 log(HR) = ∑(wi × log(HRi)) / ∑wi

SE 越小的研究(通常样本量越大、事件数越多),权重越大。合并完成后,将合并的 log(HR) 及其 CI 通过 exp() 函数反变换回 HR 尺度:

合并 HR = exp(合并 log(HR))
合并 95% CI = exp(合并 log(HR) ± 1.96 × SEpooled)
MetaReview 会自动完成以上所有计算。你只需输入原始的 HR 和 95% CI,工具在后台执行 log 变换、标准误计算、逆方差加权和反变换。

固定效应 vs 随机效应

与其他类型的 Meta 分析一样,HR Meta 分析也需要选择合并模型:

判断依据是异质性检验结果:I² > 50% 或 Q 检验 p < 0.10 时,推荐使用随机效应模型。

Forest Plot 解读

Forest Plot(森林图)是 Meta 分析最核心的可视化输出。HR 的森林图与 OR/RR 的森林图在结构上相同,但解读细节有所不同。

基本结构

元素含义
每行一个方块一项纳入研究的 HR 点估计。方块大小 = 该研究的权重(SE 越小,方块越大)。
方块两侧的横线该研究 HR 的 95% 置信区间。横线越短 = 估计越精确。
垂直虚线(x = 1)无效线(null line)。HR = 1 表示两组无差异。注意:HR 的无效值是 1,不是 0。
底部菱形合并(pooled)HR。菱形中心 = 合并 HR 点估计,菱形宽度 = 合并 95% CI。

方向解读

HR 森林图通常使用 log 尺度的 x 轴。关键判断:

解读示例: Study A: ----[====]---- HR = 0.65 (0.48, 0.88) CI 完全在左侧 → 显著有利于干预组 Study B: -----[==]-----| HR = 0.89 (0.71, 1.12) CI 跨过无效线 1 → 无统计学意义 Study C: --[======]--- HR = 0.58 (0.39, 0.86) 方块大 → 该研究权重高 Pooled: <====> HR = 0.71 (0.59, 0.85) 菱形在左侧 → 合并结果显著有利于干预
发表时需要在森林图下方标注方向:左侧标注"Favours treatment",右侧标注"Favours control"。这是 Cochrane 手册推荐的标准做法,也是审稿人经常检查的细节。

异质性指标

森林图下方通常显示异质性统计量:

如果 I² 很高(> 75%),合并的 HR 可能没有实际意义。此时应优先进行亚组分析或 meta-regression,找出异质性来源(如不同肿瘤类型、不同治疗方案、不同随访时长等)。

在 MetaReview 中进行 HR Meta 分析

MetaReview 支持 Hazard Ratio 作为效应量类型,以下是分步操作教程。

第一步:选择效应量类型

打开 MetaReview,在页面顶部的效应量下拉菜单(Effect Measure)中选择 "Hazard Ratio"。选择后,数据输入区域会自动切换为 HR 专用格式。

第二步:输入研究基本信息

在每一行中填入:

第三步:输入 HR 和置信区间

在对应列中填入:

MetaReview 会在后台自动完成 log(HR) 变换和 SE 计算,你无需手动计算。

第四步:运行 Meta 分析

输入所有研究数据后,点击 "Run Meta-Analysis" 按钮(或按 Enter 键)。系统会在几秒内完成计算。

第五步:查看分析结果

结果页面包含以下内容:

  1. 森林图(Forest Plot) — 显示每项研究的 HR、95% CI、权重和合并结果。x 轴使用 log 尺度,无效线在 HR = 1 处。
  2. 漏斗图(Funnel Plot) — 用于评估发表偏倚。对称的漏斗形状提示无明显偏倚,不对称提示可能存在小样本效应或发表偏倚。
  3. 敏感性分析(Leave-one-out) — 逐一剔除每项研究后重新计算合并 HR,检查结果是否稳健。如果剔除某项研究后合并 HR 发生显著变化,说明该研究对结果影响较大。
  4. 异质性统计量 — I²、Q 检验 p 值、τ² 等。

键盘快捷操作

提高数据录入效率的技巧:

批量录入技巧:先在 Excel 中整理好所有研究数据(Study、Year、HR、CI Lower、CI Upper),然后逐行复制粘贴到 MetaReview 中。MetaReview 支持在输入框中直接粘贴数值。

常见问题与陷阱

以下是 HR Meta 分析中最常见的错误和注意事项,避开这些陷阱能大幅提升你论文被接收的概率。

陷阱一:混用 HR 和 OR/RR

这是最严重的方法学错误。HR 来自生存分析(Cox 回归),考虑了时间维度和删失;OR 来自 Logistic 回归,RR 来自四格表,都只看固定时间点的累积事件。三者的数学基础完全不同,不能在同一个 Meta 分析中合并。

正确做法:在纳入排除标准中明确要求"研究必须报告 HR 或可从原始数据计算 HR"。对只报告 OR 的研究,单独列表讨论或排除。

陷阱二:调整 HR vs 未调整 HR

同一篇论文可能同时报告了未调整(unadjusted / univariate)HR 和调整后(adjusted / multivariable)HR。两者可能差别很大。

正确做法:在 Meta 分析方案中预先规定统一提取哪种 HR。推荐优先使用调整后的 HR,因为它更接近真实效应。重要的是所有纳入研究必须保持一致。如果确实无法统一,应在敏感性分析中探讨两种 HR 的差异。

陷阱三:忽视比例风险假设

Cox 回归模型的核心假设是比例风险假设(proportional hazards assumption):两组的风险比在整个随访期间保持恒定。如果这个假设不成立(例如两组的 KM 曲线交叉),HR 就不能准确描述两组的差异。

检查方法

正确做法:在讨论部分提及比例风险假设的局限性。如果多项研究的 KM 曲线都出现交叉,可以考虑使用限制性均值生存时间(RMST)作为替代效应量。

陷阱四:亚组 HR 的提取与使用

论文通常在森林图形式的亚组分析中报告按肿瘤类型、年龄组、PD-L1 表达水平等分层的 HR。

陷阱五:忽略随访时间差异

不同研究的中位随访时间可能差异很大(如 12 个月 vs 60 个月)。短随访可能低估长期效应,长随访可能受到交叉治疗(crossover)影响。

正确做法:在数据提取中记录各研究的中位随访时间,在 meta-regression 中探讨随访时长是否是异质性来源。

陷阱六:发表偏倚的影响

阳性结果(HR 显著 < 1)更容易发表,阴性结果可能留在文件柜里。这对 HR Meta 分析的影响尤其需要关注,因为肿瘤领域的注册研究比例虽然越来越高,但较早期的研究仍可能存在此问题。

正确做法

立即开始 HR Meta 分析

输入 HR 和 95% CI,MetaReview 自动完成 log 变换、合并计算、森林图和漏斗图。免费、无需编程。

打开 MetaReview

获取更新通知

留下邮箱,第一时间获取新功能通知和 Meta 分析技巧。

我们不会发送垃圾邮件,随时可退订。