本周最新文献速递20220313
本周最新文献速递20220313
一、精细解读文献 一
文献题目: Prediction of histone post-translational modification patterns based on nascent transcription data
不想看英文题目: 基于新生转录数据的组蛋白翻译后修饰模式预测
杂志和影响因子: Nat Genet (IF: 38.33; Q1)
研究意义: 组蛋白修饰在转录中的作用至今仍未完全了解。为此,作者使用实验扰动结合机器学习探究组蛋白修饰与转录之间的关系。
结论:
- 为了更好地理解转录和组蛋白修饰之间的关系,作者开发了一种基于转录的组蛋白插补 (dHIT) 方法。该方法根据 RNA 聚合酶的分布信息采用新生转录数据(PRO-seq、GRO-seq、ChRO-seq)评估全基因组的组蛋白修饰水平;
- image
- 除了填补常见的组蛋白(比如H3K4me1、H3K4me3 和 H3K27ac),还可以通过该方法填补较少见的组蛋白,比如 H3K122ac;
- image
- 此外,使用 dHIT 方法检测到的组蛋白可以完好反映基因转录起始位点和增强子区域;
- image
- 利用 dHIT 进行跨细胞和跨物种的组蛋白插补工作,发现跨细胞和物种的填补准确性仍然非常高,说明 dHIT 可以应用在其它新细胞类型中;
- image
- 在前面的跨细胞和跨物种比较中,作者发现 H3K27me3 在 K562 细胞的相关性较强(Pearson's R = 0.31),但在 mESCs 中相关性较差(Pearson's R = 0.06),为了查明其中的原因,作者将 H3K27me3 信号进行可视化,发现 mESCs 与 K562 细胞的 H3K27me3 分布模式差别很大。K562 细胞的 H3K27me3 信号呈广泛分布式,而 mESCs 细胞则呈点状分布模式,说明这两种模式可能反映了两种不同的细胞状态;
- image
- 前面发现 dHIT 可单独预测不同组蛋白的修饰水平,但多种组蛋白修饰状态下的复杂染色质状态的预测性能则未知。为此,作者将 ChromHMM 模型定义的 18 种不同的染色质状态进行填补,发现 dHIT 在复杂染色质状态的插补性能依旧很高,说明 dHIT 可以推断复杂的染色质状态,尤其是活跃的染色质状态;
- image
- 在 Pol II 和组蛋白修饰之间观察到很强的相关性,说明组蛋白标记和转录之间可能存在因果关系。为了评估组蛋白修饰是否需要 Pol II 活性,作者使用小分子雷公藤内酯 (Trp) 进行转录阻断观察转录抑制后组蛋白修饰的变化。结果发现 Trp 处理对 H3K36me3 或 H3K4me1 都没有影响,但对 H3K27ac 和 H3K4me3 有影响,说明 H3K27ac 和 H3K4me3 修饰依赖于转录活性;
- image
- 有研究认为几乎所有的 DNase-I 超敏感染色质区域具有转录活性,然而也有一些研究不支持这种结论,他们认为只有少部分的 DNase-I 超敏位点具有转录活性。为了解决这个争论,作者使用 PRO-seq 测序数据预测 DNase-I 超敏位点并统计与转录的相关性。结果发现大部分预测的 DNase-I 超敏位点与转录具有很强的相关性。预测较佳的窗口主要富集了活性组蛋白(H3K27ac、H3K4me3 和 H3K4me1),预测较差的区域主要富集了 CTCF 信号和转录抑制相关因子。尽管 DNase-I 在预测较差(无转录活性)和较好(有转录活性)的区域信号量相似,但仍无法启动转录,说明单有染色质可及性这个条件并不足以启动转录,还需要其它因素共同参与,比如转录因子和其他转录相关蛋白等;
- image
- 为了进一步评估染色质可及性与转录的关系,作者使用 CUT&RUN 和 ATAC-seq 评估染色质可及性和 H3 信号在转录终止后的变化,结果发现转录终止后,染色质可及性显著增加但 H3 信号丢失,说明染色质可及性主要发生在转录起始之前;
- image
亮点: 回答了组蛋白修饰和染色质可及性多大程度影响转录这个问题
文章链接:
https://www.nature.com/articles/s41588-022-01026-x
公开的资料:
- 数据: GSE163043
- 代码:
https://github.com/Danko-Lab/histone-mark-imputation
https://github.com/alexachivu/dHITpaper_2021/blob/main/Git.code_dHIT.uploa
二、精细解读文献 二
文献题目: Assessing the contribution of rare variants to complex trait heritability from whole-genome sequence data
不想看英文题目: 从全基因组序列数据评估稀有变异对复杂性状遗传力的贡献
杂志和影响因子: Nat Genet (IF: 38.33; Q1)
研究意义: 全基因组关联研究(GWAS)表明人类特征和疾病中,大约有三分之一到三分之二的遗传度被常见 SNPs 解释。然而,尚不清楚缺失的遗传度是由罕见变异还是谱系数据推断偏差导致的。为此,作者根据 25,465 名无血缘关系的欧洲血统个体进行全基因组测序并估计身高和体重指数 (BMI) 的遗传度。
结论:
- 在芯片数据中,分别对连锁不平衡(LD)区域和次等位基因频率(MAF)进行分层分析,发现 MAF 越高,对表型(身高和 BMI )解释度更大。低 LD 的低 MAF 位点比高 LD 的低 MAF 位点对表型的贡献更大。但不同芯片测序平台对表型的解释度影响不大;
- image
- 在全基因组测序数据中,同样对 LD 和 MAF 进行分层分析,与芯片数据观察到的结果一致,低 LD 变异位点对表型解释度更大,这一现象在低 MAF 区域表现的更加明显;
- 有意思的是,群体分层对遗传解释度的影响不是特别大,不论采用48、160 还是 320 个 基因组主成分(PCs)进行群体分层控制,遗传解释度的结果差别不大;
- image
- 对低 LD 区域进行功能注释,发现低 LD 区域对表型解释度更大的原因是富集了改变蛋白质的变异位点,在无富集改变蛋白质变异位点的低 LD 区域对表型的解释度贡献不大,由此说明对表型贡献度最大的主要是改变蛋白质的变异位点;
- image
评论: 大佬们之 NG 灌水
文章链接:
https://www.nature.com/articles/s41588-021-00997-7
公开的资料:
三、其他文献推荐
下面的文献也挺精彩的,但由于下不到原文,或博主时间有限,没法精细解读,故列出来供各位参阅;
当然,你们有精彩的文献想让我解读的(前提是一周内刚出炉的文献),可给我发pdf(然而可能种种原因,我不一定有时间解读,不要对我抱太高期待);
文献题目: SARS-CoV-2 is associated with changes in brain structure in UK Biobank
不想看英文题目: SARS-CoV-2 与英国生物银行中大脑结构变化相关
杂志和影响因子: Nature (IF: 42.778; Q1)
文章链接:
https://www.nature.com/articles/s41586-022-04569-5
文献题目: Whole genome sequencing reveals host factors underlying critical Covid-19
不想看英文题目: 全基因组测序揭示了关键 Covid-19 的宿主因素
杂志和影响因子: Nature (IF: 42.778; Q1)
文章链接:
https://www.nature.com/articles/s41586-022-04576-6
文献题目: Secondary structure prediction for RNA sequences including N6-methyladenosine
不想看英文题目: 包括 N6- 甲基腺苷在内的 RNA 二级结构预测
杂志和影响因子: Nat Commun (IF: 14.92; Q1)
文章链接:
https://www.nature.com/articles/s41467-022-28817-4
文献题目: Clinical and genomic features of Chinese lung cancer patients with germline mutations
不想看英文题目: 中国肺癌患者种系突变的临床和基因组特征
杂志和影响因子: Nat Commun (IF: 14.92; Q1)
文章链接:
https://www.nature.com/articles/s41467-022-28840-5
文献题目: Improved prediction of protein-protein interactions using AlphaFold2
不想看英文题目: 使用 AlphaFold2 改进蛋白质-蛋白质相互作用的预测
杂志和影响因子: Nat Commun (IF: 14.92; Q1)
文章链接:
https://www.nature.com/articles/s41467-022-28865-w
文献题目: A large and diverse autosomal haplotype is associated with sex-linked colour polymorphism in the guppy
不想看英文题目: 与孔雀鱼的性连锁颜色多态性相关的常染色体单倍型
杂志和影响因子: Nat Commun (IF: 14.92; Q1)
文章链接:
https://www.nature.com/articles/s41467-022-28895-4
文献题目: The spinach YY genome reveals sex chromosome evolution, domestication, and introgression history of the species
不想看英文题目: 菠菜 YY 基因组揭示了该物种的性染色体进化、驯化和渗透历史
杂志和影响因子: Genome Biol (IF: 10.81; Q1)
文章链接:
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-022-02633-x
文献题目: DNA demethylation affects imprinted gene expression in maize endosperm
不想看英文题目: DNA 去甲基化影响玉米胚乳中印迹基因的表达
杂志和影响因子: Genome Biol (IF: 10.81; Q1)
文章链接:
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-022-02641-x
四、工具或资源类介绍
文献题目: TraSig: inferring cell-cell interactions from pseudotime ordering of scRNA-Seq data
不想看英文题目: TraSig:从 scRNA-Seq 的伪时间排序中推断细胞间相互作用
杂志和影响因子: Genome Biol (IF: 10.81; Q1)
文章链接:
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-022-02629-7
文献题目: STRIDE: accurately decomposing and integrating spatial transcriptomics using single-cell RNA sequencing
不想看英文题目: STRIDE:使用单细胞 RNA 测序数据准确分解和整合空间转录组学
杂志和影响因子: Nucleic Acids Res (IF: 11.501; Q1)
文章链接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkac150/6543547
文献题目: LRcell: detecting the source of differential expression at the sub–cell-type level from bulk RNA-seq data
不想看英文题目: LRcell:从 RNA-seq 数据中检测亚细胞水平的差异表达来源
杂志和影响因子: Brief Bioinform (IF: 11.62; Q1)
文章链接:
文献题目: BridgeDPI: A Novel Graph Neural Network for Predicting Drug-Protein Interactions
不想看英文题目: BridgeDPI:一种用于预测药物-蛋白质相互作用的新型图神经网络
杂志和影响因子: Bioinformatics (IF: 5.61; Q1)
文章链接:
文献题目: CellWalkR: An R Package for integrating and visualizing single-cell and bulk data to resolve regulatory elements
不想看英文题目: CellWalkR:整合和可视化单细胞和 bulk 数据识别细胞类型特异性调控元件的 R 包
杂志和影响因子: Bioinformatics (IF: 5.61; Q1)
文章链接:
https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btac150/6547050
文献题目: GenRisk: A tool for comprehensive genetic risk modeling
不想看英文题目: GenRisk:遗传风险建模工具
杂志和影响因子: Bioinformatics (IF: 5.61; Q1)
文章链接:
https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btac152/6546286
文献题目: NewWave: a scalable R/Bioconductor package for the dimensionality reduction and batch effect removal of single-cell RNA-seq data
不想看英文题目: NewWave:用于单细胞 RNA-seq 数据降维和批次效应校正的 R/Bioconductor 包
杂志和影响因子: Bioinformatics (IF: 5.61; Q1)
文章链接:
https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btac149/6546285
文献题目: spatialGE: Quantification and visualization of the tumor microenvironment heterogeneity using spatial transcriptomics
不想看英文题目: spatialGE:使用空间转录组学对肿瘤微环境异质性进行量化和可视化
杂志和影响因子: Bioinformatics (IF: 5.61; Q1)
文章链接:
致谢橙子牛奶糖(陈文燕),请用参考模版:We thank the blogger (orange_milk_sugar, Wenyan Chen) for XXX
感谢小可爱们多年来的陪伴, 我与你们一起成长~