python 正则表达式：只保留字符串中的中英文和数字

2018-06-07 本文已影响0人张沐之_

问题描述

在做字符串比较的时候，一般不希望有特殊字符。比如：我要判断“某某（集团）股份有限公司”是否是上市公司，这时我便需要将该字符串和上市公司池的的字符串进行比较。但如果我这里的（是中文的，二上市公司池里的却是英文的字符(，便会导致做出该公司不是上市公司的误判。所以，在进行比较前，需要去除（这样的无实际意义的字符。

解决方法

正则表达式

import re
cop = re.compile("[^\u4e00-\u9fa5^a-z^A-Z^0-9]") # 匹配不是中文、大小写、数字的其他字符
string1 = '@ad&*jfad张132（www）。。。'
string1 = cop.sub('', string1) #将string1中匹配到的字符替换成空字符

参考

https://blog.csdn.net/github_37412255/article/details/78499071

python 正则表达式：只保留字符串中的中英文和数字

问题描述

解决方法

参考

猜你喜欢

热点阅读