2021.10.06-10.9 VDJtools学习笔记

2021-10-09  本文已影响0人  千容安

>>准备工作

install.packages(c("circlize", "grid", "gridExtra", "VennDiagram"))
java -jar vdjtools.jar Rinstall
install.packages(c("reshape2", "FField", "reshape", "gplots",
                   "gridExtra", "circlize", "ggplot2", "grid",
                   "VennDiagram", "ape", "MASS", "plotrix",
                   "RColorBrewer", "scales"))

>>传入数据

>>开始分析

一、Basic analysis

(1)CalcBasicStats

会有TCR的注释

(2)CalcSegmentUsage

(3)CalcSpectratype

(4)PlotFancySpectratype

(5)PlotFancyVJUsage

(5)PlotSpectratypeV

二、Diversity estimation

(1)Diversity estimation

(2)RarefactionPlot

(3)CalcDiversityStats

Command line usage
java -Xmx4G -jar vdjtools.jar CalcDiversityStats \ [options] [sample1.txt sample2.txt ... if -m is not specified] output_prefix

三、Repertoire overlap analysis

(1)OverlapPair

①表格输出
输出表

工作路径下产生3个txt



同时产生如下提示,忽略


②图形输出

配置完后重启电脑,在命令提示符中输入R,测试是否成功。
再次回到之前的工作路径中,输入产生图形的命令:


会产生的两个PDF文件
output_prefix.paired.strict.table.collapsed
output_prefix.strict.paired.scatter

(2)CalcPairwiseDistances

这样不算报错

java -jar ./vdjtools-1.2.1.jar CalcPairwiseDistances -p 3.clonotypes.TRA.txt 4.clonotypes.TRA.txt 5.clonotypes.TRA.txt 6.clonotypes.TRA.txt 7.clonotypes.TRA.txt 8.clonotypes.TRA.txt 3B.clonotypes.TRB.txt 4B.clonotypes.TRB.txt 5B.clonotypes.TRB.txt 6B.clonotypes.TRB.txt 7B.clonotypes.TRB.txt 8B.clonotypes.TRB.txt output_prefix

会产生 “output_prefix.intersect.batch.aa.txt” 和 “output_prefix.intersect.batch.aa.pdf”


CalcPairwiseDistances.pdf

(3)ClusterSamples

java -jar ./vdjtools-1.2.1.jar ClusterSamples -p output_prefix input_prefix
输入文件前缀 设置为与CalcPairwise 差异的输出前缀相同的值
产生表:会产生一个“input_prefix.mds.aa.F”文本文件、一个“file_out_clust”(newick)文件
产生图形(PDF):input_prefix.hc.aa.F 和 input_prefix.mds.aa.F

input_prefix.hc.aa.F
input_prefix.mds.aa.F
此处有存疑,待未来尝试解决:
一、
官方作出的图如下:
hc
命令行里也没有报错
没有报错
用notepad++打开vdjtools文件夹下的cluster_samples.r,是刚才运行R脚本,是vdjtools自动生成的,在命令行里打开R,把加箭头的两行粘贴到R命令行里

如下反馈,并不是不缺少作图包
反馈

二、
input_prefix.mds.aa.F的图里没有加颜色,有可能是vdjtools没有让它画颜色。


ClusterSamples时输入的命令

老师给的解释摘记如下,待以后用其他数据再尝试。

应该有个color_by_factor,受到某个输入参数的影响。但为何vdjtools给这个参数安排为0,恐怕后面有机会再去深究。
1、可能是这组数据没有去分组。
2、这组数据里,TCR之间真的没有交集,以至于vdjtools算不出相似度。
3、部分数据没有overlap的clone。

(4)TestClusters

Command line usage:
$VDJTOOLS TestClusters
[options] input_prefix [output_prefix]
java -jar ./vdjtools-1.2.1.jar TestClusters input_prefix input_prefix

(5)TrackClonotypes

java -jar ./vdjtools-1.2.1.jar TrackClonotypes -p 3.clonotypes.TRA.txt 4.clonotypes.TRA.txt 5.clonotypes.TRA.txt output_prefix

会产生的文件
output_prefix.tracking.strict.summary
output_prefix.tracking.strict.stackplot
output_prefix.tracking.strict.heatplot
上一篇 下一篇

猜你喜欢

热点阅读