爬虫Scrapy系列

(二) Item

2019-05-04  本文已影响0人  iamlightsmile

Item是保存爬取到的数据的容器;其使用方法和python字典类似, 并且提供了额外保护机制来避免拼写错误导致的未定义字段错误。

声明Item

Item使用简单的class定义语法以及 Field 对象来声明。例如:

import scrapy

class Product(scrapy.Item):
    name = scrapy.Field()
    price = scrapy.Field()
    stock = scrapy.Field()
    last_updated = scrapy.Field(serializer=str)

使用Item

Item复制了标准的 dict API 。包括初始化函数也相同。

在实际使用中,我们完全可以将Item类视为Python中内置的dict类来使用.

同时Field 仅仅是内置的 dict 类的一个别名,并没有提供额外的方法或者属性。换句话说, Field 对象完完全全就是Python字典(dict)。

上一篇下一篇

猜你喜欢

热点阅读