中文和双字符的匹配

2019-10-05  本文已影响0人  gyher

正则表达式中:

data = urlreq.urlopen('https://read.douban.com/provider/all').read().decode('utf-8')
# pressPattern = 'class="name">([\u4e00-\u9fa5]*(·[\u4e00-\u9fa5]+)?)'
# 出版社名称可以是中文也可以是英文
pressPattern = 'class="name">(.*?)<'
上一篇 下一篇

猜你喜欢

热点阅读