中国统计局省市区镇(街道)采集器

2019-02-28  本文已影响0人  paul_deng

github 路径:https://github.com/tsball/node-china-region-spider

node-china-region-spider 是一个基于 nodejs 技术,通过访问中国统计局网,获取省、地级市、区(县)、镇(街道)多层行政级别地区的名字 与 编号,并将数据保存到 SQLite 数据库。

目录结构

1. 程序特点

2. 数据来源

数据来源于国家统计局网

其中,不同年份的行政区域划分: http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/

3. 技术构成

方式一:修改了源 .npmrc

type puppeteer_download_host = https://npm.taobao.org/mirrors

方式二:使用 npm 单独安装 puppeteer

PUPPETEER_DOWNLOAD_HOST=https://storage.googleapis.com.cnpmjs.org npm i puppeteer 

4. 安装

# 安装所有的 js 依赖
yarn

5. 运行

# 获取最新的记录
node index.js

# 获取指定年份的记录
node index.js -y 2016

# 获取指定行政级别深度的数据(支持 province, city, district, town)
node index.js -d 3

6. 参数

# 查看参数指令
$ node index.js --help
参数 简写 默认值 描述
headless h y/n n 无头模式(没有界面)
depth d 1/2/3/4 3 采集指定行政级别深度的地区数据 (provice/city/district/town)
year y 数字 2016 采集指定年份的数据。查看年份
concurrency c 数字 3 并发请求数
interval i 毫秒 500 采集数据休息的间隙
timeout t 毫秒 3000 超时重试的时间
上一篇 下一篇

猜你喜欢

热点阅读