孟德尔随机化

How it all started

R语言中操作步骤

孟德尔随机化(Mendelian Randomization, MR)是一种基于遗传学原理的因果推断方法,通过利用自然随机分配的遗传变异(如单核苷酸多态性 SNP)作为工具变量,克服传统观察性研究中混杂因素和反向因果的干扰,从而更可靠地揭示暴露因素与疾病或健康结局之间的因果关系。

核心原理与方法

MR 的理论基础源于孟德尔遗传定律:等位基因在减数分裂时随机分配给子代,这种自然随机性使遗传变异与后天环境因素(如生活方式、社会经济地位)无关。研究者首先筛选与暴露因素(如血脂水平、BMI)显著相关的 SNP(通常基于全基因组关联研究 GWAS 数据,P < 5×10⁻⁸),然后通过两阶段最小二乘法(2SLS)或逆方差加权法(IVW)等统计方法,分析这些 SNP 与结局变量(如心血管疾病、阿尔茨海默病)的关联,从而推断暴露因素对结局的因果效应。例如,利用与载脂蛋白 B(ApoB)相关的 SNP,研究发现 ApoB 水平升高可降低脑出血风险 38%-42%,而他汀类药物可能增加深部脑出血风险。

优势与局限性

MR 的核心优势在于其 “自然随机对照试验” 特性:遗传变异在受孕时固定,不受疾病发生影响,且与混杂因素独立,从而避免了传统研究中常见的偏倚。此外,MR 可利用公开的 GWAS 汇总数据,高效分析大规模人群,例如通过分析 45 万欧洲人群数据,发现阿尔茨海默病可能通过降低四肢瘦体质量和步行速度增加肌少症风险。

然而,MR 的有效性依赖三个关键假设:①遗传变异与暴露因素强相关;②遗传变异与混杂因素无关;③遗传变异仅通过暴露因素影响结局。若假设不成立,如存在多效性(遗传变异通过其他途径影响结局)或弱工具变量(F 统计量 < 10),可能导致结果偏差。例如,多效性检验阳性提示遗传变异可能通过非暴露途径影响结局,需通过 MR-Egger 回归或 MR-PRESSO 等敏感性分析验证。

应用与发展

MR 在医学研究中广泛应用,例如:

  • 疾病机制探索:揭示叶酸水平与先心病的因果关联,为一级预防提供依据;
  • 药物靶点验证:通过模拟他汀类药物对遗传变异的影响,发现其可能增加脑出血风险,独立于降脂作用;
  • 复杂性状研究:分析基因与环境互作,如吸烟相关 SNP 与脑卒中风险的关联。

近年来,随着 GWAS 数据积累和方法学革新(如顺式 MR、多变量 MR),MR 已成为连接遗传学与流行病学的桥梁,为精准医学和药物研发提供新范式。

1.eQTL_MR代码

2.eQTL_Two_MR代码

3.pQTL_MR代码

4.Druggable_genome-wide_MR代码


“临时起意才是真的出发”

煤球