2020-11-06 小智讲堂之正则表达式(笔记)
2020-11-06 本文已影响0人
云若蓝
本文源自小智师弟教我的几个替换代码
引用:
https://docs.microsoft.com/zh-cn/dotnet/standard/base-types/regular-expression-language-quick-reference?redirectedfrom=MSDN
https://deerchao.cn/tutorials/regex/regex.htm
开始:
先附上本次使用的字符,使用的软件是notepad++。
https://deerchao.cn/tutorials/regex/regex.htm https://deerchao.cn/tutorials/regex/regex.htm https://docs.microsoft.com/zh-cn/dotnet/standard/base-types/regular-expression-language-quick-reference?redirectedfrom=MSDN目的是为了将单个文件内的多序列合并为一条序列,删除下图箭头指向的行(序列标题)。
具体步骤:
查找目标\r #windows中换行符有\r和\n两种,linux中只有\n一种
替换为 #(空),目的是消除所有\r
查找目标\n>.*\n
替换为 #(空)
即可消除文件中所有序列的标题,仅留全文件中第一条序列标题。
#若想删除所有标题,可查找目标>.*\n
另:小智师弟小讲堂的附赠部分
一
每80字符分割序列查找目标([acgt]{80}) #[acgt]指的是匹配中括号中a或c或g或t字符,{80}表示匹配数量为80个
替换为\1\n #\1表示替换为()内的内容,\n表示换行
二
以序列部分标题作为新标题 结果查找目标>(.*)-2\n
替换为\1\n
三
同样是删除所有文件中的序列标题查找目标[^acgt]{1,}
注:在标题中出现atcg的话就会保留标题中的atcg,从而影响结果。
四
通过文件查找批量替换多个文件中的序列标题注:在标题中出现atcg的话就会保留标题中的atcg,从而影响结果。
最后
请谨慎使用。
立夏快乐!