TRF (Tandem Repeat Finder) 搜寻串联重
2020-06-24 本文已影响0人
胡童远
官网:http://tandem.bu.edu/trf/trf.html
一、安装
- conda一键安装
conda install trp
trf -h
二、TRF分析
- 结果文件只能直接输出到当前文件夹,因此cd到新建的结果文件夹中运行
mkdir Result/trf
route=`pwd`
cd Result/trf
trf ../prokka/genome_prokka.fasta 2 7 7 80 10 50 500 -f -d -m
cd $route
三、结果
一共四个文件,一个个展示文件部分内容。
- genome_prokka.fasta.2.7.7.80.10.50.500.1.html
- genome_prokka.fasta.2.7.7.80.10.50.500.1.txt.html
<pre>Found at i:42183 original size:10 final size:10
[Alignment explanation](http://tandem.bu.edu/trf/trf.definitions.html#alignment)
Indices: 42170--42195 Score: 52
Period size: 10 Copynumber: 2.6 Consensus size: 10
42160 TATAACACAT
42170 AATAATACAA
1 AATAATACAA
42180 AATAATACAA
1 AATAATACAA
42190 AATAAT
1 AATAAT
42196 TCTATATGTA
Statistics
Matches: 16, Mismatches: 0, Indels: 0
1.00 0.00 0.00
Matches are distributed among these distances:
10 16 1.00
ACGTcount: A:0.69, C:0.08, G:0.00, T:0.23
Consensus pattern (10 bp):
AATAATACAA
Left flanking sequence: Indices 41670 -- 42169
ATATAGCAACTACTGTCTCTAATTGCTTTTCCTTATAGCTGTCTGACCATTCATCATGACGGAG
Right flanking sequence: Indices 42196 -- 42695
TCTATATGTATTGACTTTTAAAAATACTGCATGTATTATAAAAATATAAATCGTATTATTTATAA
- genome_prokka.fasta.2.7.7.80.10.50.500.dat
42170 42195 10 2.6 10 100 0 52 69 7 0 23 1.14 AATAATACAA AATAATACAAAATAATACAAAATAAT
75340 75612 61 4.5 60 73 13 243 37 25 18 18 1.94 AGGATCACCCCCACATACATGGGGAACACTAAATAATCCTAGTGGAAATATTCCATAAAC AGGATCACCCCCACATACATGGGGAACACTAAATAATCCTAGTGGATAATATTCCTTAAACAGGATCACCCCCACATACATGGGGAACACTTAAAGGACGTGTTGGAGATACACAAGACTACAGGATCACCCCCACATACATGGGGAACACTAGCTGAAATTTTAGGGACTACACAAAAAGTAAGGATCACCCCCACATACATGGGGAACACTAAATAATCCTAGTGGATAATATTCCTTAAACAGGAGCACCCCCACATACATGGGGAACAC
108121 108161 21 2.0 21 90 0 64 51 0 14 34 1.43 AATAATGGATAATGAGTTAAA AATAATGGATAATGAGTTAAAAATAATTGATAATGATTTAA
199168 199204 18 2.1 18 94 0 65 27 16 24 32 1.96 AGCTTTCACTTAAGGATG AGCTTTCGCTTAAGGATGAGCTTTCACTTAAGGATGA
199108 199264 78 2.0 77 87 4 226 27 18 21 33 1.96 AGCTTTCACTTAAGGATGAACTTGTACTCAAGGATTCACTCAACTGCTTGATGTACTTAAGCTTCCACTTAAGGATG AGCTTTCACTTAAGGATGAACTTGTACTCAAGGATTCACTTAATGAACTTGATGTGCTTAAGCTTTCGCTTAAGGATGAGCTTTCACTTAAGGATGAACTTGTGCTCAAGGATTCGCTCAAGCTGCTTGATGTACTTAAGCTTCCACTTAAGGATGA
199306 199340 18 1.9 18 88 0 52 25 20 22 31 1.98 AGCTTTCACTCAAGGATG AGCTTTCGCTTAAGGATGAGCTTTCACTCAAGGAT
199366 199400 18 1.9 18 88 0 52 25 20 22 31 1.98 AGCTTTCACTCAAGGATG AGCTTTCGCTTAAGGATGAGCTTTCACTCAAGGAT
- genome_prokka.fasta.2.7.7.80.10.50.500.mask
>1 [gcode=11] [organism=Genus species] [strain=strain]
ATTACTTCTTCAGCAAAGTTTTCTTCTTTCTTTTCGATACCTTCGCCAACTTCATAACGA
ACAAAAGATTTTACCTTACCATTCTTAGAAGCAACATATTTTGCAACTGTTAAATCAGGA
TCCTTAACAAAGTCTTGATCATCCAATGCAACTTCTGCAAAGAACTTGTTCAAGCGACCA
GCAACCATTTTTTCAATGATTTTTTCTGGCTTACCTTCATTCTTAGCTTCTTCTGTAAGA
ACTTCCTTTTCATGTGCAACTTCAGCTTCTGGAACTTCATCACGGTTTACATACTTAGGA
TTAATAGCAGCAACGTGCATAGCAACATCCTTAGCTGTAGCTTCATCAGCACCTTCTACT
ACTGACAATACAGCAATACGTCCACCATCGTGTAAGTATGCACCAAAGTTGTCAGCGTCT