省市区数据获取(一) - 源数据
2018-08-24 本文已影响25人
番薯IT
聊骚
不知道大家有没有碰到这样的一种情况。我们在开发的时候,大部分的项目都是需要用到省市县(区)的数据的,但是其实我不知道我怎么获取到完整的这些数据。换句话说就是我怎么才能得到权威的数据。
网上其实有一大片这样的数据,但是不能保证是不是我们想要的数据,也不能保证数据的准确性。所以其实我们需要的是如何得到完整和准确的数据,这样不管你怎么变,我们都能得到我们想要的。
授人以鱼不如授人以渔就是这么个理了。
给你们渔
就是上面的那个网站,国家统计局,厉害吧。点开看,然后按下图指引操作:
统计局首页.png然后就进入到下面的图片了。没有什么意外,就是继续操作。
操作.png好,看到数据了,记录了所有的省、直辖市、自治区。我们点开广东省看下。
省份数据.png广东省对应的市也显示出来了,还有对应的代码,可以说很棒了。要获取对应区的数据,继续往下点就ok了。
市级.png问题
至此,我们找到了我们想要的数据了,但是问题是:我们怎么得到这些数据(名称和代码)。不可能我们一个个的去统计吧!
我们当然想到用程序处理。那么我们就需要爬取对应的数据,并做相应的解析。爬取数据,大家的第一反应是用python
爬取,但是很惭愧,我并不会python
。当然java
也是有办法爬取的,那就是 jsoup。
具体的内容请看 省市区数据获取 - Jsoup解析网页获取。