文章套路科研-统计学相关生信

关于生信建模,你可能只需要这一篇就够了

2019-08-19  本文已影响282人  vegene

​建模对于生物信息而言是一个神奇的存在,经常听生物信息工程师讲建模、建模,那到底什么是建模呢?

建模是建立模型的简称,通俗地讲,建立模型的过程就是用一系列的技术手段,将一些东西分类,或者将某种东西从一堆东西中挑出来。

这里面的某种东西可以是样本、可以是基因、可以是lncRNA等等。

而这一系列的技术手段就是建模的方法。如果你理解了我上面所说的,你就能明白模型的概念很宽泛。我们可以根据预后建立模型,可以根据特征建立模型,可以根据风险建立模型,可以用机器学习建立模型。我们当然也可以根据自己的喜好,将基因分组,但这通常没什么科学意义,所以掌握科学的建立模型技术是十分必要的。

我在本简书号上介绍过一些建模文章和方法:

9分的Deep Learning肝癌建模文献介绍

实战(五)模仿一篇曾经10+胃癌亚型预后相关的文章

实战系列(四)来自Aging(5分)的免疫微环境研究 (基于ESTIMATE算法,进行免疫评分和基质打分,我认为一种广义的建模,并且用差异预后做验证,至于别人是否认可,见仁见智)

风险分类模型SVM文章解析

一篇5分甲状腺癌分型文章的解读

实战系列(二)CCR数据挖掘建模文章操作

COX 比例风险回归模型

一篇经典的WGCNA套路分析

基于20个基因的预后模型预测肺腺癌的生存

我在微信公众号上发过的建模文章帖子:

基因共表达网络分析口腔鳞癌中的关键模块和hub基因 (这篇是转发其他作者的文章,内容不错,而且已获得作者认可)

实战系列(三)模仿4分胃癌发病机制和预后关键基因的文章 (寻找预后key gene,是最普遍的预后建模方法)

实战系列(一)手把手复现3分lncRNA经典小文章 (这里面用到了一个分类的模型)

今天第一次总结,这么一看还真是不少...

还有一些文章,作者构建了样本亚型和预后生存的关系,但是并没有强调模型的效率和稳定性,也不具备普遍适用性,这种文章暂时先放一边。

我们团队通过归纳整理几十篇建模类文章,梳理了建模文章的思路规范,有了这一规范,基本可以适用于所有疾病的建模方案(只要有足够量得数据支撑),也可以用来评估别人模型建立的优劣。

这张图能否让大家回忆起之前建模过程中的点滴呢?

不过我并不准备把详细的内容发布出来,有用的资料应该成为细心好学之人的武器,将这个帖子发布到朋友圈并获取10个赞

加我微信可以详谈建模类科研课题合作的细节

将截图私信与我,可以得到详细整理的建模规范PDF

这个二维码这么大真的有点碍眼,但我不会调......

桑格科研出品,欢迎大家关注桑格助手

上一篇 下一篇

猜你喜欢

热点阅读