「学转录组入门生信」第一周从环境配置开始
2019-07-07 本文已影响27人
xuzhougeng
image
我们第一周目标有三个:
- 熟悉Linux环境
- 登录服务器
- Linux基本命令
- PATH的意义
- 学习conda管理环境
- 如何在conda中添加channel
- 如何用conda安装和卸载软件
- 如何创建新的环境和切换环境
- 数据准备
首先,你需要有一个Linux环境,Windows10用户可以安装WSL,MacOS请在应用程序中搜索终端
- Windows10配置WSL: https://linux.cn/article-9545-1.html
- MacOS的环境配置: https://blog.csdn.net/orangleliu/article/details/47357339
然后,你需要学一些基础的Linux的命令操作,如下是鸟哥的Linux私房菜的对应链接
- 目录管理:http://linux.vbird.org/linux_basic/0210filepermission.php
- vim使用说明: http://linux.vbird.org/linux_basic/0310vi.php
- shell基础: http://linux.vbird.org/linux_basic/0320bash.php 中的10.1,10.2,10.3和10.4
再接着你需要用conda安装如下软件
- sra-tools: 数据下载
- fastqc: 查看数据质量
- cutadapt, trimmomatic: 数据质控
- star, hisat2: 数据比对
- samtools: SAM/BAM文件处理
- subread, htseq: 基因计数
conda的教程推荐看https://www.jianshu.com/p/edaa744ea47d
学有余力: 整理网络上关于这些软件的资源
接着你得下载如下数据:
- 参考基因组序列: 在 http://www.ensembl.org/ 上下载 GRCh38的参考基因组序列
- 注释文件:在 http://www.ensembl.org/ 上下载 GRCh38 对应的注释GFF文件
- SRR数据:编号为 SRR4820707,SRR4820708, SRR4820709,SRR4820710, SRR4820727, SRR4820728, SRR4820729, SRR4820730 (我上传了微云,链接:https://share.weiyun.com/5lFLZzL)
以上就是第一周的内容了。