效应量选择决策图
不知道该选哪个效应量?按这个流程走:
你的结局数据是什么类型?
│
├── 二分类(是/否、死亡/存活、有效/无效)
│ │
│ ├── 病例对照研究?
│ │ └── → 用 OR(比值比)
│ │
│ └── RCT 或队列研究?
│ └── → 用 RR(风险比)
│ (如果事件率 < 10%,OR ≈ RR,两者均可)
│
├── 生存数据(时间到事件、Kaplan-Meier、Cox 回归)
│ └── → 用 HR(风险比)
│ 输入论文报告的 HR 和 95% CI
│
└── 连续性(均值、评分、测量值)
│
├── 各研究用相同量表/单位?
│ └── → 用 MD(均数差)
│ 例:血压 mmHg、体重 kg、HbA1c %
│
└── 各研究用不同量表?
└── → 用 SMD(标准化均数差)
例:不同抑郁量表(PHQ-9、BDI、HAM-D)
OR 比值比(Odds Ratio)
定义
OR 比较两组的事件比值(odds)。Odds = 事件发生概率 / 事件不发生概率。
OR = (a/b) / (c/d) = (a × d) / (b × c)
其中 a = 干预组事件数,b = 干预组非事件数,c = 对照组事件数,d = 对照组非事件数。
适用场景
- 病例对照研究 — 这是唯一可以使用 OR 的设计(因为无法直接计算发病率)
- Logistic 回归调整后的效应量通常报告为 OR
- 事件率很低(<10%)时,OR 近似等于 RR
解读
| OR 值 | 含义 |
| OR = 1 | 两组无差异 |
| OR < 1 | 干预组事件比值低于对照组(如果事件是不良结局,说明干预有保护作用) |
| OR > 1 | 干预组事件比值高于对照组 |
常见陷阱:当事件发生率较高(>10%)时,OR 会夸大效应大小。例如真实的 RR = 2.0,但 OR 可能显示为 3.0 甚至更高。此时不应用 OR 代替 RR。
RR 风险比(Risk Ratio)
定义
RR 比较两组的事件概率(risk)。Risk = 事件发生人数 / 总人数。
RR = (a / (a+b)) / (c / (c+d))
适用场景
- RCT(随机对照试验) — 干预效果评估的首选
- 队列研究 — 暴露与结局的关联
- 临床报告中更直观:RR = 0.7 → "风险降低 30%"
RR vs OR 的关系
| 对照组事件率 | 真实 RR | 对应 OR | 偏差 |
| 5% | 2.0 | 2.1 | 微小 |
| 20% | 2.0 | 2.7 | 明显 |
| 40% | 2.0 | 4.7 | 严重 |
结论:事件率越高,OR 和 RR 差距越大。如果你的研究是 RCT 或队列设计,优先用 RR。
HR 风险比(Hazard Ratio)
定义
HR 比较两组的事件发生速率(hazard rate)。用于生存分析、时间到事件分析。
HR = hazard(干预组) / hazard(对照组)
适用场景
- 生存分析 — 癌症生存率、心血管事件时间、疾病复发等
- Cox 比例风险回归 — 论文报告 HR + 95% CI
- Kaplan-Meier 曲线配合 log-rank 检验
解读
| HR 值 | 含义 |
| HR = 1 | 两组无差异 |
| HR < 1 | 干预组事件发生速率低(如死亡更慢 → 干预有保护作用) |
| HR > 1 | 干预组事件发生速率高(干预有害或风险因素) |
Meta 分析中如何输入 HR 数据
大多数论文直接报告 HR 和 95% 置信区间。在 MetaReview 中:
- 选择效应量类型为 "Hazard Ratio"
- 输入论文报告的 HR 值(原始尺度,非 log 值)
- 输入 95% CI 下限和上限
- 系统自动完成 log 变换和 SE 计算
HR 的 Meta 分析在内部使用 log(HR) 进行计算,因为 log(HR) 近似服从正态分布。但你只需输入原始 HR 和 CI,MetaReview 会自动处理转换。
HR 和 OR/RR 虽然都是比值型效应量,但数据来源完全不同(生存数据 vs 2×2 表格),不能在同一个 Meta 分析中混合使用。
MD 均数差(Mean Difference)
定义
MD 是两组均值的直接差值,保留原始单位。
MD = Mean(干预组) - Mean(对照组)
适用场景
- 各研究使用相同量表和单位测量结局
- 例:所有研究都测量收缩压(mmHg)、体重(kg)、HbA1c(%)
优势
MD 有直接的临床意义。MD = -5.2 mmHg 意味着干预组比对照组血压低 5.2 mmHg,临床医生一看就懂。
如果论文只报告了"均值差及其 95% CI"而没有报告各组的均值和 SD,你可以直接使用报告的 MD 和 CI 参与 Meta 分析(使用 generic inverse-variance 方法)。
SMD 标准化均数差(Standardized Mean Difference)
定义
SMD 将均值差除以合并标准差,消除量表差异。最常用的计算方法是 Hedges' g(校正后的 Cohen's d)。
SMD = (Mean(干预组) - Mean(对照组)) / SD(pooled)
适用场景
- 各研究使用不同量表测量同一概念
- 例:不同研究用 PHQ-9、BDI-II、HAM-D 测量抑郁程度
- 例:不同研究用 SF-36、EQ-5D、WHOQOL 测量生活质量
Cohen's d 解读标准
| SMD 绝对值 | 效应大小 | 临床含义 |
| 0.2 | 小效应 | 效果存在但不太明显 |
| 0.5 | 中等效应 | 有临床意义的改善 |
| 0.8 | 大效应 | 显著的临床改善 |
SMD 失去了原始单位,临床解释不如 MD 直观。审稿人可能要求你将 SMD 转换回某个代表性量表的原始单位(乘以该量表的 SD)以便临床解读。
五种效应量对比总表
| 特征 | OR | RR | HR | MD | SMD |
| 数据类型 | 二分类 | 二分类 | 生存数据 | 连续性 | 连续性 |
| 无效值 | 1 | 1 | 1 | 0 | 0 |
| 保留原始单位 | 否 | 否 | 否 | 是 | 否 |
| 临床可解释性 | 中 | 高 | 高 | 高 | 低 |
| 推荐研究设计 | 病例对照 | RCT/队列 | Cox回归/KM | 量表统一 | 量表不同 |
| 统计特性 | 对称性好 | 有方向限制 | 比例风险假设 | 正态近似好 | 正态近似好 |
常见选择错误与后果
- 高事件率时用 OR 代替 RR — 会夸大效应量,误导临床判断。审稿人经常指出这个问题。
- 量表相同时用 SMD 代替 MD — 丢失临床意义。"血压降低 0.3 个标准差"远不如"血压降低 5 mmHg"有用。
- 量表不同时强行用 MD — 合并不同量纲的数据没有统计学意义,得到的合并值无法解读。
- 混合使用 OR 和 RR — 同一个 Meta 分析中,所有研究必须使用同一种效应量。不能部分研究用 OR、部分用 RR。
在 MetaReview 中切换效应量
MetaReview 支持一键切换五种效应量:
- 在"数据提取"页面输入原始数据
- 切换到"分析结果"页面
- 在顶部下拉菜单选择效应量类型(OR / RR / HR / MD / SMD)
- 所有统计量、森林图、漏斗图实时更新
建议先用最适合你研究设计的效应量做主分析,然后在敏感性分析中换一种效应量验证结果是否一致。例如主分析用 RR,敏感性分析用 OR,如果结论一致则更可靠。
用 MetaReview 计算效应量
支持 OR/RR/HR/MD/SMD 一键切换,自动计算合并效应量和异质性。免费、无需编程。
打开 MetaReview
获取更新通知
留下邮箱,第一时间获取新功能通知和 Meta 分析技巧。
我们不会发送垃圾邮件,随时可退订。