数据分析Python新世界

利用Python做了一个GEO下载器!这个爬虫我觉得可以给满分!

2018-11-04  本文已影响25人  919b0c54458f

什么是GEO?什么是Python?

GEO: Gene Expression Omnibus

简单讲就是别人发文章后上传的 基因表达数据集。主要是芯片(Array-based)的数据,也有一部分是测序(Sequence-based)的数据。

Python:is an interpreted high-level programming language for ...

就是一门编程语言,Python应该多少都听说过吧。人生苦短,我用Python ...

为什么要下GEO?为什么要用Python?

理论上:当你需要重复、验证别人实验结果的时候,就要用到这些GEO的原始数据了。

实际上:没钱没样本你怎么搞研究(灌水)?只能去垃圾桶(GEO)里翻别人吃剩下的...

当然这个说的有点过分,其实这些数据就是为了提供给其他研究者进行进一步挖掘用的,毕竟人多力量大。对于很多人来说,这也是练习生信数据分析非常好的数据来源。

说到Python,现在搞个研究,你不会点编程都有点说不过去。而Python可能是目前学编程的不二之选,一句话:容易上手社区好。光从入门难度来说,可能算得上最容易的编程语言之一。不仅如此,目前全球Python开发者众多,广泛应用于各个领域,特别是数据分析和人工智能领域。这意味着什么呢,大量的工具不需要自己重新开发即可直接使用别人开发好的,简单便捷。当然,自己动手也能丰衣足食。

其实下载GEO数据途径有很多,用Python写个下载工具,娱乐成分更多一些。

Talk Is Cheap, Show Me The Code

编程大神Linus的名言(这人值得谷歌一下,Linux的创始人,身上传说很多)

下面就上代码了,挂在Github上:

https://github.com/stonepy/fishbone/blob/master/geo-downloader.py

欢迎大家提建议留言~ 有问题往死里吐槽

不会编程的各位,有兴趣的话可以等后续文章,从编程零基础开始,带大家写这个简单小程序入门Python。

进群:548377875   即可获取神秘大礼包一份!

上一篇下一篇

猜你喜欢

热点阅读