3 数据获取与表示
2018-05-20 本文已影响0人
liustudy



help(open)


方法:和对象有关的函数

建议使用with,异常处理(创建),更加简洁有效

读文件从指针位置开始
with语句在执行后会主动关闭文件句柄,不需要f.close()

读入多行(不删除换行符)
读入一行
写入多行
没有writeline,该功能与write相似


读写时有一个文件指针,数据从文件指针处开始读写
添加f.seek(0)到倒数第二行前(即读取之前),就可以完整输出字符串



抓取:客户机给服务器发送一个请求(request),服务器返回一个响应(response),
对响应进行解析

抓取网页前,先看是否有爬虫协议(robots.txt)


通过get()方法,发送请求,获得一个response对象。对象包括request请求信息和服务器的response响应信息
requests自动解码(re.json());
响应内容是二进制,re.content()解码;re.text()自动推测文本编码,并进行解码;re.encoding='utf-8',修改文本编码












enumerate()返回一个enumerate对象,元素是由索引与值构成的元组
zip打包




























