转录组学

单细胞数据科学四大过程组两大知识领域与三重境界

2022-05-28  本文已影响0人  周运来就是我

很多朋友问是如何保持阅读量的,其实,大部分是之前的存货。有一部分是每有会意,把之前的旧书拿出来再翻一翻,做个导图放上来的。今天,我想和大家分享一点最近对单细胞数据科学的理解,总结为一句话:

单细胞数据科学四大过程组两大知识领域与三重境界

说到单细胞数据科学,不得不回忆起2020年的一个无名的夜晚,那一晚无意间浏览到一篇文章:

Eleven grand challenges in single-cell data science ,Lähnemann et al. Genome Biology (2020) 21:31

这是我第一次知道有单细胞数据科学这一概念,后来以single-cell data science(SCDS)作为关键字,做过几次检索,也读过几本数据科学的书籍,这个概念慢慢明晰起来。当别人在讨论单细胞数据分析、生信分析、数据挖掘的时候,我开了一个单细胞数据科学专栏。在单细胞生信分析到单细胞数据科学的过渡中,有一篇文章不得不提:

Luecken MD, Theis FJ. Current best practices in single-cell RNA-seq analysis: a tutorial. Mol. Syst. Biol. 2019, 15: e8746.

在这篇文章中,作者提出了单细胞数据分析的最佳实践,也奠定了目前大部分单细胞数据分析的基本框架:

不管哪家公司做的数据分析,不管是哪个平台的单细胞数据,数据分析的基本流程逃不过这个流程。

现在看来,虽然这两年单细胞技术也在发展,数据分析工具依然层出不穷,但是2020年的时候,数据分析的基本框架基本形成。这两年大家基本上是在反刍前人的理念。

这并不妨碍我们依然可以发现许多新的见解,如任老师在一次访谈中提出:

书读百遍,其意自见。下面就来分享一下:单细胞数据科学四大过程组两大知识领域与三重境界。

四大过程组

单细胞数据科学的过程主要是:

两大知识领域

单细胞数据科学可以分为两大知识领域,一个是细胞层面的细胞生物学,一个是基因表达或者表观的高通量多组学。

这两大知识领域目前都是在不断快速发展过程中,单细胞技术也在促进我们不断拓展这两大知识领域的认知边界。

三重境界

说起三重境界,我们都不陌生。虽然我们已经归纳出单细胞数据科学有迹可循,但是这一点也不妨碍数据科学是一个需要探索、发掘、验证、攀登的科学这一事实。特别是单细胞技术在如此火热的大环境下,不少朋友想吃快餐,昨晚连夜释放的数据,天一亮就从网上复制代码来分析自己的数据。

我们不要忘记单细胞数据科学也有三重境界:

【降维聚类,必知必会】很简单,能配置分析环境和复制代码就可以。
具备一定的生物学背景之后,【探索时贪婪,验证时谨慎】也不是难事。
但是真正走过四大过程组,谙熟两大知识领域,历尽三重境界方才修得单细胞数据科学家之名。

在节目的最后,作者本人在单细胞数据科学四大过程组两大知识领域与三重境界的基础上,寄语单细胞数据科学新人六大箴言:

加油,少年,开卷有益(juan,第一声)。

上一篇下一篇

猜你喜欢

热点阅读