2021.10.13-10.21 MIXCR学习笔记
>>准备工作
安装
下载mixcr
命令行输入:java -jar D:\mixcr-3.0.13\mixcr.jar align input.fastq.gz output.vdjca
切换工作路劲:cd C:\mixcr-3.0.13
输入:java -jar mixcr.jar
>>背景知识
典型的MiXCR工作流程主要由三个部分构成:
- align:将测序结果比对到T细胞或B细胞受体的V、D、J、C基因参考序列上
- assemble:利用前一步骤获得的比对结果拼接clonotypes(为了提取特定的基因区域信息,比如CDR3)
- export:输出比对结果(exportAlignments模块)或者clones信息(exportClones模块),生成可读文件
MiXCR的assemble模块有几种不同的拼接方法可以选择:
- assembleContigs:拼接完整的TCR或者IG受体clonotype序列
- 对于RNA-Seq or non-targeted DNA data, 工作流程可能包括以下两部分:
- assemblePartial:将有重叠区域的序列片段拼接成相对较长的包含CDR3区域的contigs
- extend: 估算测序和比对质量较好但长度较短的TCR比对序列的germline序列
为了简化输入命令,MiXCR提供了analyze命令模块,打包了整个分析流程
MiXCR支持一下若干种数据类型:fasta,fastq,fastq.gz,paired-end fastq和fastq.gz。作为每一步骤的输出结果,MiXCR生成包含各种信息的二进制压缩文件(比对生成alignments,拼接生成clones)。利用exportAlignments和exportClones命令模块,每一个二进制文件都可以转化成tab分割的可读文本文件。
analyze
模式,可以一站式完成(align、assemblePartial、extend、assemble、assembleContigs、export) 这些分析
使用的数据来源:
第一次输入:有错误
java -jar ./mixcr.jar analyze amplicon --species hs --starting-material dna --5-end v-primers --3-end j-primers --adapters adapters-present --receptor-type IGH A1_1.clean.fq A1_2.clean.fq analysis
- 不关命令行,ctrl+c即可停止正在进行的命令
hs改为mmu,是小鼠的数据,IGH改成TCR,老师没有做过BCR的数据
改成输入:
java -jar ./mixcr.jar analyze amplicon --species mmu --starting-material dna --5-end v-primers --3-end j-primers --adapters adapters-present --receptor-type TCR A1_1.clean.fq A1_2.clean.fq analysis
得到文件如下:
其中TRA如下:
analysis.clonotypes.TRA
用了老师给的十几个数据的前两个样品,这个文件将V、D、J基因数据都囊括。
目标是得到老师要求的table,模板之一如下:
TRA.V
是将所有样品中TRA.V的基因都整合。
老师说进一步用vdjtools的Convert过滤数据
由帮助信息可知,convert在util里面,在官网上找到命令行
用法、帮助信息
option为加-S MiXcr,表示输入数据为mixcr结果
命令:java -jar ./vdjtools-1.2.1.jar Convert -S MiXcr analysis.clonotypes.TRA.txt output_prefix
得到结果如下:
output_prefix.analysis.clonotypes.TRA
对table的一些解读:
这部分,标记的应该是CDR3片段上面,VDJ基因的分界点
freq就是频数。毕竟T细胞需要大量克隆,才能应对特定的病变细胞。count就是TCR重复的数目。这个数目以核酸序列为准来计算的。
若最后4列是-1,则它们就不必考虑,这里的-1,表示没有有效数据,当作NA处理
还是V、D、J基因数据都整合的内容,老师认为改用immunarch里的geneusage:
geneusage
于是用immunarch里的geneusage,滑铁卢了,出现情况如下:
老师分析认为,immunarch安装不成功是R版本太高(4.1.1),建议用3.6.3的版本。
接下来考虑R多版本共存能不能行。
安装3.6.3后绑定rstudio,仍不能用:
选择一下CRAN镜像试试,找个中国区的:
chooseCRANmirror()
再次install.packages("immunarch")
下载包及其依赖的包安装:shiny、bslib
安装不了bslib:
要升级htmltools包,Rstudio右下方有packages框,在那边能找到升级按钮
更换了绑定的r版本就解决了。