生信软件和工具

Notepad++ 正则表达式 | fasta 文件

2021-07-23  本文已影响0人  新_世_界

Notepad++ 常用的处理文本的正则表达式

1. 在每行开头加16进制颜色

查找:^
替换:#FFB6C1

2. 合并多行代码为1行

查找:[\r\n\t]
替换:

3. 去除特定字符冒号:之前的所有字符(不包括>)。

原始文件:

>TraesCS6B02G079100:TraesCS6B02G079100.1
ATGTACCGTTGTGCTGTGGTCTTTCTGATCGTGGTGGCCGCCTGCACTCCGGCCATGAGCAGCTTTTGGCAGCAGGCCCTCCCGGCCTTGTG
>TraesCS3D02G280460:TraesCS3D02G280460.1
ATGGATAGGCTCGTCGCCGCCGGCATCCTTGGCTTTCTACTGATTGCGTCGGTAGGAAGCCAGGCAGCTCGTGCTCCGGAGCAATACTGGAAGTCTGCTCTTC

☝注意:其实方法二更加精确!

替换后:

>TraesCS6B02G079100.1
ATGTACCGTTGTGCTGTGGTCTTTCTGATCGTGGTGGCCGCCTGCACTCCGGCCATGAGCAGCTTTTGGCAGCAGGCCCTCCCGGCCTTGTG
>TraesCS3D02G280460.1
ATGGATAGGCTCGTCGCCGCCGGCATCCTTGGCTTTCTACTGATTGCGTCGGTAGGAAGCCAGGCAGCTCGTGCTCCGGAGCAATACTGGAAGTCTGCTCTTC

4. 删除特定字符: 之后的所有字符(不包括:)

替换后:

>TraesCS6B02G079100
ATGTACCGTTGTGCTGTGGTCTTTCTGATCGTGGTGGCCGCCTGCACTCCGGCCATGAGCAGCTTTTGGCAGCAGGCCCTCCCGGCCTTGTG
>TraesCS3D02G280460
ATGGATAGGCTCGTCGCCGCCGGCATCCTTGGCTTTCTACTGATTGCGTCGGTAGGAAGCCAGGCAGCTCGTGCTCCGGAGCAATACTGGAAGTCTGCTCTTC
上一篇下一篇

猜你喜欢

热点阅读