python中re.findall如果包含(.*?)结果为什么不
2020-10-10 本文已影响0人
萤火虫叔叔
问?(.*?)在python中和java中表现不一样?
最近在学习爬虫,对html
字符串用python
的re
解析后,发现结果和预期不太一样,代码和结果如下

然后用java
对同一段html字符串进行测试,发现结果符合预期。

结论:如果正则表达式包含(xxx)
,re
会对结果进行了优化,自动去除非(xxx)
以外的内容(注:xxx
为具体的正则表达式)