碎碎念-拐个弯的GEO处理
2020-01-29 本文已影响0人
Juan_NF
- 如果R下载网速不快,可以考虑
wget -c
下载压缩包;
1)现在windows10 应用商城有ubuntu的可兼容版本,适用了下,很好用;
2)git版本,git bash here也很好用;
3)有3点:a.我们下载的数据是从XXXseries_matrix.txt.gz提取的,而下载链接是有规律的;b.我们提取表达矩阵即非‘!’开头的行;c.提取表型信息即!Sample开头的行;
wget -c ftp://ftp.ncbi.nlm.nih.gov/geo/series/GSE5nnn/GSE5364/matrix/GSE5364_series_matrix.txt.gz
zcat GSE5364_series_matrix.txt.gz |grep '!Sample' >pd.txt
zcat GSE5364_series_matrix.txt.gz |grep -v '!' >ex.txt