Notepad++ 正则表达式 | fasta 文件
2021-07-23 本文已影响0人
新_世_界
Notepad++ 常用的处理文本的正则表达式
1. 在每行开头加16进制颜色
查找:^
替换:#FFB6C1
2. 合并多行代码为1行
查找:[\r\n\t]
替换:
3. 去除特定字符冒号:
之前的所有字符(不包括>
)。
原始文件:
>TraesCS6B02G079100:TraesCS6B02G079100.1
ATGTACCGTTGTGCTGTGGTCTTTCTGATCGTGGTGGCCGCCTGCACTCCGGCCATGAGCAGCTTTTGGCAGCAGGCCCTCCCGGCCTTGTG
>TraesCS3D02G280460:TraesCS3D02G280460.1
ATGGATAGGCTCGTCGCCGCCGGCATCCTTGGCTTTCTACTGATTGCGTCGGTAGGAAGCCAGGCAGCTCGTGCTCCGGAGCAATACTGGAAGTCTGCTCTTC
- 方法一
查找:.*\:
替换:>
- 方法一
- 方法二
查找:([A-Za-z0-9]*)(\:)([A-Za-z0-9]*\.[0-9])
替换:\3
- 方法二
☝注意:其实方法二更加精确!
替换后:
>TraesCS6B02G079100.1
ATGTACCGTTGTGCTGTGGTCTTTCTGATCGTGGTGGCCGCCTGCACTCCGGCCATGAGCAGCTTTTGGCAGCAGGCCCTCCCGGCCTTGTG
>TraesCS3D02G280460.1
ATGGATAGGCTCGTCGCCGCCGGCATCCTTGGCTTTCTACTGATTGCGTCGGTAGGAAGCCAGGCAGCTCGTGCTCCGGAGCAATACTGGAAGTCTGCTCTTC
4. 删除特定字符:
之后的所有字符(不包括:
)
- 方法一
查找:\:.*$
替换:>
- 方法一
- 方法二
查找:([A-Za-z0-9]*)(\:)([A-Za-z0-9]*\.[0-9])
替换:\1
- 方法二
替换后:
>TraesCS6B02G079100
ATGTACCGTTGTGCTGTGGTCTTTCTGATCGTGGTGGCCGCCTGCACTCCGGCCATGAGCAGCTTTTGGCAGCAGGCCCTCCCGGCCTTGTG
>TraesCS3D02G280460
ATGGATAGGCTCGTCGCCGCCGGCATCCTTGGCTTTCTACTGATTGCGTCGGTAGGAAGCCAGGCAGCTCGTGCTCCGGAGCAATACTGGAAGTCTGCTCTTC