单细胞学习

【细胞通讯】PlantPhoneDB(1)

2022-08-07  本文已影响0人  jjjscuedu

前面介绍了很多细胞通讯的文章,我也提过植物做这块还几乎没有。今天就读到一篇植物这块相关的研究,最近发表到PBJ上面,所以今天这篇分享一下这个工作。下篇分享一下使用体验。

还是带着前面讲的几个作者这个工作的相关问题去读这个paper:

  1. 如何构建植物配体-受体库

  2. 如何定义配体-受体互作的score

  3. 如何删选显著的配体-受体互作对,或者定义相应的统计学参数pvalue

=======植物配体-受体库的构建========

对于拟南芥,和cellphoneDB类似,利用关键词(secreted和cell membrane)搜索uniprot,从而鉴定可能的配体和受体信息。除此之外,还在TAIR,PlantSecKB库中检索了receptor kinase gene和secretomes。然后从BioGRID,Interactome,IntAct,plant.MAP(CF-MS score>0.5),STRING(score>600)提取相关的protein-protein interaction信息。

另外,还从CellTalkDB,SingleCellSignalR,CSOmap中提取人类的配体-受体互作对,然后利用InParanoid获取拟南芥的同源基因对。

对于除拟南芥的非模式生物,则是采用以下图中的几个tool进行配体和受体的预测。比如receptor主要通过预测膜蛋白等,ligand主要是secret的能力和特征。蛋白蛋白互作则是通过CAMP软件预测的。

整个过程读完,感觉还是有几个不足的地方:

=======配体-受体互作score以及显著性的定义========

从文中来看,作者采用了4中计算score的方式来定义score以及显著性,第一种是LRscore,来自于SingleCellSignalR;第二/三种是Product和Average(简单的说就是配体和受体在不同细胞类型采取乘积和平均值的方法),是和CellPhoneDB类似,pvalue是根据吧cell type随机了1000次获得的;最后一种是WeightProduct,采取的是只选取在至少10%cell表达的配体和受体,然后采取平均值(听起来和三种的average差不多,只不过听起来多了一个cutoff 10%而已,具体怎么来的,文中并未描述,合理与否我也不清楚)。

重要的看完,看下这个文章都做了一些什么。

1. 依据前面说的配体-受体库收集方法,目前,该数据库收录了拟南芥、水稻、番茄、玉米和杨树五个物种的配体-受体互作对。除此之外,还收集了这5个物种15个组织的29份单细胞数据的信息,包括处理条件、细胞个数以及测序平台等,并且提供了在线文档。总体来看,拟南芥包含3514个配体-受体对,其中包含574配体和585受体。其它物种情况如下图。

然后还和唯一一个包含植物的库scTensor进行了对比,阐述了一下各方面的优势。

2. 作者收集了目前已发表的植物单细胞相关的数据,并在网站上进行了聚类以及单个基因表达的展示 (常规操作)。

在分析这些单细胞数据的时候,主要对于现在常用的细胞类型鉴定方法软件进行了对比。

3. 然后根据作者采用的4种score的定义方式,开始做了score函数在人类常见的pbmc 3k和8k上的结果对比。结果发现top 10 最常见的cell interaction四种score方法都可以鉴定出来,来说明四种score函数都是较为精准的。但是还是建议作者要注意四种score函数的不同,以及自己数据集的特点。最后建议预测的时候至少采用2个score函数。(感觉说了很多,又好像没说,总觉得评价标准选择的不太好,个人觉得应该找那个配体-受体互作的标准集来评价,用cell-cell interaciton是否太过于general,纯属个人意见

4. 最后,作者运用开发R包PlantPhoneDB探索热胁迫下拟南芥根组织细胞的复杂通讯网络。从结果可以看出,PlantPhoneDB可以预测出有显著通讯活性的AT1G28290-AT2G14890配体-受体互作对,该配体-受体互作对所调控的靶基因富集到核糖体通路。热胁迫可能会引起核糖体暂停现象,这种热触发的 mRNA 降解似乎是植物在慢性热胁迫下适应和生存所必需的。这些发现为进一步了解细胞如何相互通讯以响应热应激提供了重要的线索。

所以整理来说,作为植物研究细胞通讯的首个工具,肯定比较有用的。但是还是有很多可提升的空间。下一篇分享一下使用和测试情况。

本文使用 文章同步助手 同步

上一篇下一篇

猜你喜欢

热点阅读