爬虫-Beautiful Soup

2020-12-22  本文已影响0人  唐人三藏

一、Beautiful Soup是一个可以从HTML或XML文件中提取数据的Python库,是来自bs4库;

导入:from bs4 import Beautiful Soup

二、find_all 可以截取获取的部分内容,小括号里为爬取网站信息的架构

三、find_all,可以通过添加标签值,精准获取信息

四、通过文本检索内容

五、通过limit限制输出的量

上一篇 下一篇

猜你喜欢

热点阅读