非线性孟德尔随机化简介
2022-12-18 本文已影响0人
张旭的医学大数据
VX公众号:有何AI与医学,孟德尔随机化准备从大家问题多地方以及简单介绍写起来,然后补全整个分析流程!欢迎转发关注哦!
非线性孟德尔随机化研究之前也有很多同学问过我,但是手里没有数据,就没有详细的介绍。最近认识的一些朋友课题组有自己的全基因组数,今天我们详细的聊一聊非线性MR。
非线MR怎么做?
我们试想一下,假定暴露是连续变量维生素D的浓度,将其分为8段,匹配8组样本,然后分别做8次GWAS会出现什么情况,由于变量成正太分布,这8段所分配到的样本量是不同的,必然与的组样本量太小,统计效能大大下降,此外,每一段相关的SNP有几乎相同,相同的情况减少了统计效应太不应该了吧。当然像高血压低血压在临床有标准分段是合适的。
基因风险评分(GRS)
我们首先介绍一下基因风险评分,基因风险评分算法是目前具有较大应用前景的预测疾病风险的方法,其相关领域的发展受到广泛关注。早期的孟德尔随机化分析多是以一种疾病的GRS作为暴露的效应,然后和结局进行回归。自15年以后,逆方差加权等方法的提出而逐渐被取代。
其数学公式如下,下一篇详细介绍。
基因风险评分,作为全基因组分析的拓展分析有重要的意义,多基因风险评分综合了人类基因组中更多的效益,来评估疾病的风险。进而提高原发病预防的成本效益、更精确的诊断以及提高药物处方的准确性。缺点是存在很多的不定性,GWAS对疾病的解释依然有限,存在偏移,容易被误解误读。
GRS与非线性MR
刚才我们说分段GWAS是不合理的,那么GWAS后再进行分段呢?非线性MR实际上就是先做GWAS找到与疾病相关位点,之后进行GRS,然后对GRS进行分段,把分的每一段与结局进行回归,最后每一段拼接拟合成一条曲线,这里简单介绍操作后边介绍。