利用SQL分析深圳餐饮人气情况

2018-09-29  本文已影响0人  龍猫君

如果想知道深圳地区什么类型餐饮最受欢迎,主要有哪些餐饮类型,需要大众点评深圳地区的聚餐美食的餐饮店铺数据进行分析。

一、提出问题

  1. 深圳地区餐饮类型主要有哪些?
  2. 哪种餐饮类型最受欢迎?
  3. 餐饮类型人均消费情况怎样的?
  4. 人均消费范围主要集中哪个价位?

二、导入数据

打开Navicat,新建表之后右键点击“导入向导”,选择excel文件路径,选中相应的表名导入。

到下面这里的栏位名行:对应的excel中的列名,第一个数据行:excel从第几行开始,这里选择第二行开始(如果默认选择1,会出现两个字段列名),最后一个数据行:指的是excel从第几行结束,这里选择默认的。

二:理解数据

store_name :店铺名称 comment:评论人数

price: 价格 score:口味评分

condition:环境评分 sevice:服务评分

category:餐饮类型 address:地址

导入数据之后显示如下:


1.查看餐饮总数

select count(store_name) as '总餐饮数' from shenzhenfood

查看餐饮总共数量有747条数据

2.深圳餐饮类型总数统计

SELECT category as '餐饮类型',COUNT(category) as '餐饮统计'
FROM shenzhenfood
GROUP BY category
ORDER BY COUNT(category) DESC

深圳本地的粤菜、日本料理和火锅类型数量最多,说明当地这三种类型的餐饮生意好,受欢迎度高,开张的餐饮比较多。

3.查看什么类型的餐饮最受欢迎?

SELECT category as '餐饮类型',SUM(comment) AS '评价人数' 
FROM shenzhenfood
GROUP BY category
ORDER BY SUM(comment) DESC

我们可以从评价人数分组餐饮类型进行排序,由于关顾餐饮消费的人数多,评论人数也会上升,所以餐饮评价人数在一定程度上可以反映该餐饮的受欢迎度,通过排序选择了评价总人数前七的餐饮类型,可以看出粤菜评价人数最多,其次是火锅类。在广东本地城市,深圳的粤菜是挺受欢迎的,另外麻辣类型的菜也受欢迎。

4.查看餐饮类型的人均消费情况

降序排序人均消费

SELECT category as '餐饮类型', 
ROUND(AVG(price),2) AS '人均消费'
FROM shenzhenfood
GROUP BY category
ORDER BY AVG(price) DESC

升序排序人均消费

SELECT category as '餐饮类型', 
ROUND(AVG(price),2) AS '人均消费'
FROM shenzhenfood
GROUP BY category
HAVING AVG(price)!=''  
ORDER BY AVG(price)  

餐饮类型和人均消费排序之后可以发现,人均消费价格比较高的是日本料理和自助餐,分别是322.55元和279.41元,而人均消费价格低的是贴近生活亲民的面包甜点和小吃快餐。说明比较贴近市民生活饮食的餐饮类型价格是相对较低的,而国外的餐饮和特殊的菜型价格相对较高。 选择去聚餐的时候可以根据自己喜欢的口味和经济条件去选择相应的餐馆聚餐。

5.餐饮类型与平均评分关系怎样的?

SELECT category AS '餐饮类型',ROUND(AVG(score),1) AS '平均评分'  
FROM shenzhenfood
GROUP BY category
ORDER BY AVG(score) DESC

排序结果显示小龙虾口味平均评分最高达到8.7分,深圳市民对于海鲜评分高,喜爱海鲜类型的食材。

6.查看深圳地区餐饮的定价主要集中在哪个范围?

SELECT (CASE WHEN price >0 AND price <=50 THEN '0-50'
    WHEN price >50 AND price <=100 THEN '50-100'
    WHEN price >100 AND price <=300 THEN '100-300'
    ELSE '300以上' END) AS '定价范围',
COUNT(category) AS '餐饮数目'
FROM shenzhenfood
GROUP BY  (CASE WHEN price >0 AND price <=50 THEN '0-50'
    WHEN price >50 AND price <=100 THEN '50-100'
    WHEN price >100 AND price <=300 THEN '100-300'
    ELSE '300以上' END)
ORDER BY COUNT(category) DESC

定价分为四个等级,分组价格范围进行排序查询结果显示100-300元餐饮数目最多为343家,其次是50-100元为317家。最低是50元以下的有29家。可以看出平均消费在100-300元左右是大多数商家定的合理价格,说明市民去聚餐消费在100-300元是容易接受的消费价格,对于我们聚餐还是以自己经济条件去选择了。

结论:

1.深圳地区的粤菜、日本料理和火锅餐饮类型数量多,说明当地偏向这种类型的饮食人数多;

2.粤菜、火锅和四川菜评价人数最多的,说明这三种菜品在深圳很受欢迎,不仅喜爱粤菜还喜爱具有麻辣类型的菜,也喜爱海鲜类型的菜。

3.日本料理和自助餐平均价格高,而贴近市民生活的小吃快餐价格相对较低。

4.深圳地区餐饮人均定价范围主要集中在100-300元,相对来说还是可以接受的。

由于深圳地区餐饮数据量比较少,不能很好的反应餐饮具体的消费情况,其中粤菜和日本料理的餐饮数量最多,平均人数也最多的,各种餐饮类型数量相差比较大,在分析价格和欢迎度方面有一定的影响。SQL数据查询分析不仅仅局限在一个表里,在数据量大的情况下会有多表查询,这里作为练习SQL进行简单的分析实践。

下次练习抓取多个城市进行分析餐饮

上一篇下一篇

猜你喜欢

热点阅读