什么是 HR Meta 分析
在医学研究中,许多临床结局都是"时间-事件"型数据:患者从治疗开始到疾病进展、死亡或其他终点事件发生的时间。这类数据被称为生存数据(survival data),分析方法统称为生存分析(survival analysis)。
当多项研究都报告了同一干预对生存结局的影响时,我们需要用 Meta 分析将它们合并起来,得到一个更精确的总体估计。生存数据 Meta 分析的核心效应量是 Hazard Ratio(HR,风险比)。
HR 的定义
HR 是两组之间瞬时事件发生率(hazard rate)的比值。它来自 Cox 比例风险回归模型,考虑了随访时间和删失(censoring)。HR = 0.70 意味着在任意时间点,干预组的事件发生速率是对照组的 70%,即干预降低了 30% 的风险。
什么时候需要 HR Meta 分析
- 肿瘤学 — 总生存期(OS)、无进展生存期(PFS)、无病生存期(DFS)是最常见的终点。几乎所有肿瘤 RCT 都报告 HR。
- 心血管疾病 — 主要不良心血管事件(MACE)的发生时间、心衰住院或死亡的复合终点。
- 感染性疾病 — 至病毒学治愈的时间、至感染复发的时间。
- 器官移植 — 移植物存活时间、至排异反应发生时间。
- 慢性病管理 — 糖尿病肾病进展时间、COPD 急性加重间隔时间。
HR vs RR:不要混淆
HR 和 RR 都叫"风险比",但它们完全不同:
| 特征 | HR(Hazard Ratio) | RR(Risk Ratio) |
| 数据来源 | Cox 比例风险回归 / 生存分析 | 四格表 / 累积发病率 |
| 是否考虑时间 | 是,考虑事件发生的时间点 | 否,只看固定时间点的累积事件数 |
| 处理删失数据 | 是,能正确处理失访和删失 | 否,删失患者通常被排除或简单处理 |
| 无效值 | 1 | 1 |
| 典型场景 | 肿瘤 OS/PFS,心血管 MACE | RCT 中的二分类结局(治愈率、死亡率) |
关键区别:HR 基于整个随访期间的事件率,RR 基于固定时间点的累积事件率。两者不能在同一个 Meta 分析中混用。如果你的纳入研究有的报告 HR、有的报告 RR,必须分开分析。
如何从论文中提取 HR 数据
提取 HR 数据是生存分析 Meta 分析中最关键也最容易出错的步骤。根据论文报告的完整程度,提取方式分为三种场景。
场景一:论文直接报告 HR + 95% CI(最常见、最简单)
这是最理想的情况。大多数高质量 RCT 和队列研究都会在文中或表格中直接报告 Cox 回归的 HR 及其 95% CI。
示例:论文报告 "HR = 0.72, 95% CI: 0.58-0.90"。你只需要记录这三个数字:
- HR = 0.72
- CI Lower = 0.58
- CI Upper = 0.90
MetaReview 会自动完成后续的 log 变换和标准误计算。
提取位置优先级:正文结果部分 > Table(通常在 multivariable analysis 表中)> Figure 图注 > Supplementary material。如果多个模型都报告了 HR,优先选择调整后的(adjusted)HR,因为它控制了混杂因素。
场景二:论文报告 HR + p 值(无 CI)
有些较早期的论文或会议摘要只报告了 HR 和 p 值,没有 95% CI。此时可以通过 p 值反推标准误。
方法:
- 从 p 值查找对应的 z 值(例如 p = 0.05 对应 z = 1.96,p = 0.01 对应 z = 2.576)
- 计算 log(HR) 的标准误:SE = |log(HR)| / z
- 再反推 95% CI:CI = exp(log(HR) ± 1.96 × SE)
SE[log(HR)] = |log(HR)| / z
其中 z = 正态分布分位数,对应论文报告的 p 值
示例:论文报告 HR = 0.65, p = 0.003。
- p = 0.003(双侧)对应 z = 2.968
- log(0.65) = -0.431
- SE = |-0.431| / 2.968 = 0.145
- 95% CI = exp(-0.431 ± 1.96 × 0.145) = exp(-0.715, -0.147) = (0.489, 0.863)
注意:如果论文只报告 "p < 0.05" 这种模糊表述,直接用 z = 1.96 会高估标准误(低估精确度)。这是保守估计,可以接受但不理想。最好联系原作者获取精确数据。
场景三:论文只有 Kaplan-Meier 曲线(无 HR 报告)
这是最困难的情况。一些老文献或阴性结果的研究可能只展示了 KM 曲线,没有报告 HR。
此时需要使用 Tierney 等人(2007)的方法从 KM 曲线间接估算 HR。核心步骤:
- 使用数字化工具(如 WebPlotDigitizer)从 KM 曲线图上提取各时间点的生存概率坐标
- 结合论文中报告的各时间点风险人数(number at risk,通常在 KM 图下方)
- 根据提取的数据重建每个时间段的事件数和删失数
- 使用这些重建的 IPD(individual patient data)近似数据估算 HR
参考文献:Tierney JF, Stewart LA, Ghersi D, Burdett S, Sydes MR. Practical methods for incorporating summary time-to-event data into meta-analysis. Trials. 2007;8:16.
Tierney 方法有配套的 Excel 计算工具,可在论文附录中下载。如果 KM 曲线下方没有风险人数表,估算的精度会大幅降低。在纳入排除标准中,可以考虑将"无法提取 HR"作为排除理由。
数据提取表模板
建议使用以下标准化表格记录提取的数据:
| 提取字段 | 说明 | 示例 |
| 第一作者 | 研究的第一作者姓名 | Wang |
| 发表年份 | 论文发表年份 | 2023 |
| 研究设计 | RCT / 队列 / 其他 | RCT |
| 干预组 | 实验组的干预措施 | 免疫治疗 + 化疗 |
| 对照组 | 对照组的处理 | 化疗 |
| 结局指标 | OS / PFS / DFS 等 | OS |
| HR | 风险比 | 0.72 |
| 95% CI 下限 | 置信区间下界 | 0.58 |
| 95% CI 上限 | 置信区间上界 | 0.90 |
| HR 类型 | 调整 / 未调整 | Adjusted |
| 数据来源 | 直接报告 / p值推算 / KM提取 | 直接报告 |
HR 的统计原理
理解 HR Meta 分析的统计基础,有助于正确执行分析和识别错误。核心要点是:HR 的合并不是在原始尺度上进行的,而是在 log 尺度上。
为什么要做 log 变换
HR 的取值范围是 (0, +∞),分布是右偏的。例如 HR = 0.5(风险减半)和 HR = 2.0(风险翻倍)虽然效应大小相等但方向相反,在原始尺度上到无效值 1 的距离却不同(0.5 vs 1.0)。
经过 log 变换后:
- log(0.5) = -0.693,log(2.0) = 0.693 -- 到零点的距离相等
- log(1.0) = 0 -- 无效值变为 0,便于统计检验
- log(HR) 近似服从正态分布 -- 满足 Meta 分析所需的统计假设
log 变换:yi = log(HRi)
标准误的计算
已知 HR 和 95% CI 时,标准误的计算公式为:
SE[log(HR)] = (log(CIupper) - log(CIlower)) / 3.92
其中 3.92 = 2 × 1.96,因为 95% CI = log(HR) ± 1.96 × SE,所以 CI 宽度 = 2 × 1.96 × SE。
示例:HR = 0.72, 95% CI (0.58, 0.90)
- log(HR) = log(0.72) = -0.329
- log(0.90) = -0.105
- log(0.58) = -0.545
- SE = (-0.105 - (-0.545)) / 3.92 = 0.440 / 3.92 = 0.112
逆方差加权合并
Meta 分析使用逆方差加权法(inverse-variance method)在 log 尺度上合并各研究的 log(HR):
权重 wi = 1 / SEi²
合并 log(HR) = ∑(wi × log(HRi)) / ∑wi
SE 越小的研究(通常样本量越大、事件数越多),权重越大。合并完成后,将合并的 log(HR) 及其 CI 通过 exp() 函数反变换回 HR 尺度:
合并 HR = exp(合并 log(HR))
合并 95% CI = exp(合并 log(HR) ± 1.96 × SEpooled)
MetaReview 会自动完成以上所有计算。你只需输入原始的 HR 和 95% CI,工具在后台执行 log 变换、标准误计算、逆方差加权和反变换。
固定效应 vs 随机效应
与其他类型的 Meta 分析一样,HR Meta 分析也需要选择合并模型:
- 固定效应模型(Fixed-effect):假设所有研究估计的是同一个真实 HR。适用于研究间高度同质的情况。
- 随机效应模型(Random-effects):假设各研究的真实 HR 存在差异,合并的是 HR 的平均值。适用于研究间存在异质性的情况,也是更常用的选择。
判断依据是异质性检验结果:I² > 50% 或 Q 检验 p < 0.10 时,推荐使用随机效应模型。
Forest Plot 解读
Forest Plot(森林图)是 Meta 分析最核心的可视化输出。HR 的森林图与 OR/RR 的森林图在结构上相同,但解读细节有所不同。
基本结构
| 元素 | 含义 |
| 每行一个方块 | 一项纳入研究的 HR 点估计。方块大小 = 该研究的权重(SE 越小,方块越大)。 |
| 方块两侧的横线 | 该研究 HR 的 95% 置信区间。横线越短 = 估计越精确。 |
| 垂直虚线(x = 1) | 无效线(null line)。HR = 1 表示两组无差异。注意:HR 的无效值是 1,不是 0。 |
| 底部菱形 | 合并(pooled)HR。菱形中心 = 合并 HR 点估计,菱形宽度 = 合并 95% CI。 |
方向解读
HR 森林图通常使用 log 尺度的 x 轴。关键判断:
- HR < 1(无效线左侧):干预组事件发生率低于对照组 = 干预有利(favours treatment)
- HR > 1(无效线右侧):干预组事件发生率高于对照组 = 对照有利(favours control)
- CI 跨过无效线 1:该研究的结果无统计学意义(p > 0.05)
- 菱形完全在无效线一侧:合并结果有统计学意义
解读示例:
Study A: ----[====]---- HR = 0.65 (0.48, 0.88)
CI 完全在左侧 → 显著有利于干预组
Study B: -----[==]-----| HR = 0.89 (0.71, 1.12)
CI 跨过无效线 1 → 无统计学意义
Study C: --[======]--- HR = 0.58 (0.39, 0.86)
方块大 → 该研究权重高
Pooled: <====> HR = 0.71 (0.59, 0.85)
菱形在左侧 → 合并结果显著有利于干预
发表时需要在森林图下方标注方向:左侧标注"Favours treatment",右侧标注"Favours control"。这是 Cochrane 手册推荐的标准做法,也是审稿人经常检查的细节。
异质性指标
森林图下方通常显示异质性统计量:
- I²:异质性占总变异的百分比。I² = 0% 表示无异质性,> 50% 表示中高度异质性,> 75% 表示高度异质性。
- Q 检验 p 值:p < 0.10 提示存在显著异质性(注意阈值是 0.10 而非 0.05,因为 Q 检验统计效力低)。
- τ²:研究间方差的估计值(随机效应模型)。
如果 I² 很高(> 75%),合并的 HR 可能没有实际意义。此时应优先进行亚组分析或 meta-regression,找出异质性来源(如不同肿瘤类型、不同治疗方案、不同随访时长等)。
在 MetaReview 中进行 HR Meta 分析
MetaReview 支持 Hazard Ratio 作为效应量类型,以下是分步操作教程。
第一步:选择效应量类型
打开 MetaReview,在页面顶部的效应量下拉菜单(Effect Measure)中选择 "Hazard Ratio"。选择后,数据输入区域会自动切换为 HR 专用格式。
第二步:输入研究基本信息
在每一行中填入:
- Study:研究名称,通常是"第一作者 + 年份",例如 "Wang 2023"
- Year:发表年份,用于排序和亚组分析
第三步:输入 HR 和置信区间
在对应列中填入:
- HR:Hazard Ratio 的点估计值,例如 0.72
- CI Lower:95% 置信区间下限,例如 0.58
- CI Upper:95% 置信区间上限,例如 0.90
MetaReview 会在后台自动完成 log(HR) 变换和 SE 计算,你无需手动计算。
第四步:运行 Meta 分析
输入所有研究数据后,点击 "Run Meta-Analysis" 按钮(或按 Enter 键)。系统会在几秒内完成计算。
第五步:查看分析结果
结果页面包含以下内容:
- 森林图(Forest Plot) — 显示每项研究的 HR、95% CI、权重和合并结果。x 轴使用 log 尺度,无效线在 HR = 1 处。
- 漏斗图(Funnel Plot) — 用于评估发表偏倚。对称的漏斗形状提示无明显偏倚,不对称提示可能存在小样本效应或发表偏倚。
- 敏感性分析(Leave-one-out) — 逐一剔除每项研究后重新计算合并 HR,检查结果是否稳健。如果剔除某项研究后合并 HR 发生显著变化,说明该研究对结果影响较大。
- 异质性统计量 — I²、Q 检验 p 值、τ² 等。
键盘快捷操作
提高数据录入效率的技巧:
- Tab 键:在输入框之间快速跳转
- Enter 键:添加新研究行或运行分析
- 输入完一项研究的数据后,按 Tab 跳到下一个字段,比用鼠标点击更快
批量录入技巧:先在 Excel 中整理好所有研究数据(Study、Year、HR、CI Lower、CI Upper),然后逐行复制粘贴到 MetaReview 中。MetaReview 支持在输入框中直接粘贴数值。
常见问题与陷阱
以下是 HR Meta 分析中最常见的错误和注意事项,避开这些陷阱能大幅提升你论文被接收的概率。
陷阱一:混用 HR 和 OR/RR
这是最严重的方法学错误。HR 来自生存分析(Cox 回归),考虑了时间维度和删失;OR 来自 Logistic 回归,RR 来自四格表,都只看固定时间点的累积事件。三者的数学基础完全不同,不能在同一个 Meta 分析中合并。
正确做法:在纳入排除标准中明确要求"研究必须报告 HR 或可从原始数据计算 HR"。对只报告 OR 的研究,单独列表讨论或排除。
陷阱二:调整 HR vs 未调整 HR
同一篇论文可能同时报告了未调整(unadjusted / univariate)HR 和调整后(adjusted / multivariable)HR。两者可能差别很大。
- 未调整 HR:只考虑干预和结局的关系,不控制其他变量。通常来自 log-rank 检验或单因素 Cox 回归。
- 调整 HR:控制了年龄、性别、分期等混杂因素后的效应。来自多因素 Cox 回归。
正确做法:在 Meta 分析方案中预先规定统一提取哪种 HR。推荐优先使用调整后的 HR,因为它更接近真实效应。重要的是所有纳入研究必须保持一致。如果确实无法统一,应在敏感性分析中探讨两种 HR 的差异。
陷阱三:忽视比例风险假设
Cox 回归模型的核心假设是比例风险假设(proportional hazards assumption):两组的风险比在整个随访期间保持恒定。如果这个假设不成立(例如两组的 KM 曲线交叉),HR 就不能准确描述两组的差异。
检查方法:
- 查看原始论文的 KM 曲线是否交叉
- 查看论文是否报告了 Schoenfeld 残差检验
- 如果 KM 曲线在早期分离、后期交叉,说明干预的效果随时间变化,单一 HR 无法完整描述
正确做法:在讨论部分提及比例风险假设的局限性。如果多项研究的 KM 曲线都出现交叉,可以考虑使用限制性均值生存时间(RMST)作为替代效应量。
陷阱四:亚组 HR 的提取与使用
论文通常在森林图形式的亚组分析中报告按肿瘤类型、年龄组、PD-L1 表达水平等分层的 HR。
- 如果你的 Meta 分析关注的是总体效应,应提取总体(overall)HR,而非某个亚组的 HR
- 如果你的 Meta 分析本身就是针对某个亚组(如"PD-L1 高表达人群的免疫治疗效果"),则应提取对应亚组的 HR
- 不要把同一研究的多个亚组 HR 当作独立研究纳入,这会导致信息重复使用和统计偏差
陷阱五:忽略随访时间差异
不同研究的中位随访时间可能差异很大(如 12 个月 vs 60 个月)。短随访可能低估长期效应,长随访可能受到交叉治疗(crossover)影响。
正确做法:在数据提取中记录各研究的中位随访时间,在 meta-regression 中探讨随访时长是否是异质性来源。
陷阱六:发表偏倚的影响
阳性结果(HR 显著 < 1)更容易发表,阴性结果可能留在文件柜里。这对 HR Meta 分析的影响尤其需要关注,因为肿瘤领域的注册研究比例虽然越来越高,但较早期的研究仍可能存在此问题。
正确做法:
- 检索 ClinicalTrials.gov 等注册平台,寻找已完成但未发表的研究
- 在漏斗图中检查是否对称
- 使用 Egger 检验或 Begg 检验定量评估发表偏倚
- MetaReview 自动生成漏斗图,帮助你直观判断
立即开始 HR Meta 分析
输入 HR 和 95% CI,MetaReview 自动完成 log 变换、合并计算、森林图和漏斗图。免费、无需编程。
打开 MetaReview
获取更新通知
留下邮箱,第一时间获取新功能通知和 Meta 分析技巧。
我们不会发送垃圾邮件,随时可退订。