2020-11-06 小智讲堂之正则表达式(笔记)

2020-11-06  本文已影响0人  云若蓝

本文源自小智师弟教我的几个替换代码

引用:

https://docs.microsoft.com/zh-cn/dotnet/standard/base-types/regular-expression-language-quick-reference?redirectedfrom=MSDN

https://deerchao.cn/tutorials/regex/regex.htm

开始:

先附上本次使用的字符,使用的软件是notepad++。

https://deerchao.cn/tutorials/regex/regex.htm https://deerchao.cn/tutorials/regex/regex.htm https://docs.microsoft.com/zh-cn/dotnet/standard/base-types/regular-expression-language-quick-reference?redirectedfrom=MSDN

目的是为了将单个文件内的多序列合并为一条序列,删除下图箭头指向的行(序列标题)。

具体步骤:

查找目标\r    #windows中换行符有\r和\n两种,linux中只有\n一种

替换为    #(空),目的是消除所有\r

查找目标\n>.*\n

替换为    #(空)

即可消除文件中所有序列的标题,仅留全文件中第一条序列标题。

#若想删除所有标题,可查找目标>.*\n

另:小智师弟小讲堂的附赠部分

每80字符分割序列

查找目标([acgt]{80})    #[acgt]指的是匹配中括号中a或c或g或t字符,{80}表示匹配数量为80个

替换为\1\n    #\1表示替换为()内的内容,\n表示换行

以序列部分标题作为新标题 结果

查找目标>(.*)-2\n

替换为\1\n

同样是删除所有文件中的序列标题

查找目标[^acgt]{1,}

注:在标题中出现atcg的话就会保留标题中的atcg,从而影响结果。

通过文件查找批量替换多个文件中的序列标题

注:在标题中出现atcg的话就会保留标题中的atcg,从而影响结果。

最后

请谨慎使用。

立夏快乐!

上一篇下一篇

猜你喜欢

热点阅读