爬虫-Beautiful Soup

2020-12-22 本文已影响0人唐人三藏

一、Beautiful Soup是一个可以从HTML或XML文件中提取数据的Python库，是来自bs4库；

导入：from bs4 import Beautiful Soup

二、find_all 可以截取获取的部分内容，小括号里为爬取网站信息的架构

三、find_all,可以通过添加标签值，精准获取信息

四、通过文本检索内容

五、通过limit限制输出的量

上一篇下一篇

猜你喜欢

热点阅读