食在广州 | 爬取分析广州6万+餐饮门店数据
继前两期分别爬取了海珠某区域和海珠区美食餐厅数据进行分析,应读者要求,本期更进一步,获取了全广州60000+个餐饮门店数据进行分析。不少读者对全广州的各种餐厅数据非常感兴趣。好了,马上安排。
错过前两期的请查看下面链接或者查看美食餐厅类专辑:
技术吃货用Python爬取广州海珠区1845个中式餐厅数据
疫情过后重新开店,如何参考商业数据(数据干货)
一、广州11区餐厅门店数量和人均消费
image
天河、白云的人口商业都是全广州最繁华的,门店数量果然也是遥遥领先,天河作为商业中心,人均消费也是最高的。但总体来看,人均消费差别不大,价格上都比较适中。
二、不同餐厅门店数量和人均消费
我们选取了其中五个数量最多的分类:中餐厅、外国餐厅、快餐厅、咖啡厅、茶艺馆|冷饮店|蛋糕店|甜品店|休闲餐厅。各种餐厅门店数量和人均消费:
image.png注:这里的快餐厅是指连锁品牌:如麦当劳肯德基、品牌茶餐厅和连锁快餐大家乐等,外卖门店并不在此次的统计中,所以可能会有所遗漏
由此可见还是中餐厅是主流。分析餐厅门店很重要的指标是地理位置,所以对比了一下中餐和外国餐厅门店的地理分布图,(红:中餐厅,绿:外国餐厅)。外国餐厅数量较少,但是主要分布在天河珠江新城CBD和海珠越秀等商业区。
image单纯以区和餐饮门店类型做维度,很难直观查看到区和餐厅类型的关系,所以把这两个维度结合起来,做了一个矩形树图,让我们来看看不同区不同餐厅类型的数量分布:
image矩形树图在数据分析中实现层次结构可视化的图表结构。柱形图不适合表达过多类目(比如上百)的数据,那应该怎么办?矩形树图出现了。它直观地以面积表示数值,以颜色表示类目,初次接触时都感觉到非常惊艳。Python pyecharts制作比较复杂,需要将数据放在特定格式的json格式,如果使用Tableau等可视化工具则使用拖拽方式即可。
#做一个所有分类的树形图
final_list = []
cate_list = data_unique.groupby(by='adname').count()
#第一层
for i in range(len(cate_list)):
cateName = cate_list.index[i] #区名
#第二层
sub_list = data_unique[data_unique.adname==cateName].groupby(by='newType').count()
two_list = []
for j in range(len(sub_list)):
temp_dict = {'value':sub_list.iloc[j]['name'], 'name':sub_list.index[j]}
two_list.append(temp_dict)
temp_dict = {'value':category_rank.iloc[i]['name'], 'name':category_rank.index[i], 'children':two_list}
print(temp_dict)
final_list.append(temp_dict)
天河果然是上班族的天地,快餐厅的门店数量是最多的。
image.png海珠区的美食大排档是出了名的,所以特色地方风味餐厅数量是最多的,其次是快餐厅和冷饮店,果然是逛街吃饭的好去处。
image好了,关于不同类型门店数量的分析就到这里,想更进一步了解,只需要下载html自己查看即可,无需编程开发。
三、细分类型门店数量和人均消费
前面做的餐厅分类是以中西餐大类作为分析对象,其实很多人关注的是更加细分领域,比如火锅店、川菜店、日本料理或者韩国料理等等,让我们来看看什么样的餐厅最贵吧:
image法国餐厅人均293元一枝独秀,看来法国菜一顿饭吃3个小时是有原因的。其他类型的都没有超过人均100元的,其中的烧烤店是应做烧烤店的朋友要求,专门做一次烧烤店的分析,所以选取了店面包含“烧烤”的门店进行统计,数量上仅有839家,肯定有所遗漏,人均消费上,62元表示还能接受。当然也可以做其店面周边的门店类型数量和人均消费,下一期我们再做其他类型的分析。
如果你想知道其他城市的数据或者其他类型门店的数据,请留言告诉我,下一期说不定就是你想知道的内容。
如果对代码和矩形树图的html文件感兴趣,可以在公众号(迷途小球迷)后台回复:餐厅 即可。
数据来源:高德地图API