python 正则表达式:只保留字符串中的中英文和数字

2018-06-07  本文已影响0人  张沐之_

问题描述

在做字符串比较的时候,一般不希望有特殊字符。比如:我要判断“某某(集团)股份有限公司”是否是上市公司,这时我便需要将该字符串和上市公司池的的字符串进行比较。但如果我这里的是中文的,二上市公司池里的却是英文的字符(,便会导致做出该公司不是上市公司的误判。所以,在进行比较前,需要去除这样的无实际意义的字符。

解决方法

正则表达式

import re
cop = re.compile("[^\u4e00-\u9fa5^a-z^A-Z^0-9]") # 匹配不是中文、大小写、数字的其他字符
string1 = '@ad&*jfad张132(www)。。。'
string1 = cop.sub('', string1) #将string1中匹配到的字符替换成空字符

参考

https://blog.csdn.net/github_37412255/article/details/78499071

上一篇 下一篇

猜你喜欢

热点阅读