Kaggle: video_games_sales数据集探索性分

2020-07-23  本文已影响0人  YoungHu

注: 该分析报告的数据源自Kaggle中video_games_sales数据集, 该分析利用Python进行数据清洗,利用Taleau和python的matplotlib包进行可视化。

1 数据概况

该数据集收集了16598个电子游戏在全球的销售数据。

该数据集总共包含16598条数据记录,包含如下条目:

2 数据清洗

2.1 数据读取
import pandas as pd 
import numpy as np 
data = pd.read_csv('./vgsales.csv')
data.head()
data.info()
2.2 缺失值处理
# 缺失值检测
data.isna().any()
data.dropna(axis=0, how='any',inplace=True)

该数据集Year和Publisher两列包含缺失值,对含有缺失值的数据记录予以删除。

2.3 数据类型转换

数据中Year对应的值应由浮点型(float)转换为整型(int)。

data.Year = data.Year.astype(int)
data.info()
2.4 异常值处理
# 查看每一年对应的数据记录数
data.groupby('Year').size()

data = data[(data['Year'] != 2017) & (data['Year'] != 2020)] 
data.groupby('Year').size()
print('游戏类型数:',len(data['Genre'].unique()))
print('发行平台数:',len(data['Platform'].unique()))
print('发行商数:',len(data['Publisher'].unique()))

游戏类型数: 12
发行平台数: 31
发行商数: 576

# 所有发行商名称并对其按ASCII码值排序
publisher = data['Publisher'].unique()
publisher.sort()
publisher
Publisher = data['Publisher']

# Sony子发行商名称统一为'Sony'
for i in range(len(Publisher)):
    if Publisher[i].find('Sony') != -1:
        Publisher[i] = 'Sony'
data['Publisher'] = Publisher
data['Rank'] = range(1,len(data)+1)
data.index = range(len(data))
2.5 保存数据
data.to_csv('./clean_vgsales2.csv', index=False)

将数据进行保存,用于后续Tableau可视化。

3 探索性分析

该部分可视化结果部分来自Python,部分来自Tableau。

3.1 宏观分析

1 历年全球发行游戏数目和销量变化

Fig.1 上图:历年全球发行游戏数目变化趋势 下图:历年全球总销量变化趋势

2 各地区电子游戏销量分布

Fig.2 各地区电子游戏销量分布

除欧洲、北美、日本之外的其他地区的游戏市场有待开发,对于想要扩大市场份额的发行商可以重点考虑发展这三者之外的其他地区的游戏市场

3 各游戏平台电子游戏销量分析

Fig.3 游戏平台销量及发行游戏数目

4 游戏发行商电子游戏销量分析

Fig.4 游戏发行商的销量和发行游戏数目

5 各游戏类型销量分析

Fig.5 各游戏类型的销量和发行数量

6 二八定律分析

Fig.6 二八定律分析

3.2 地区市场分析

1 各地区销量变化趋势

Fig.7 各地区游戏销量变化趋势

建议: 对于想要迅速做大做强的电子游戏开发者应该重点考虑北美和欧洲地区的玩家需求

2 不同地区top10销量的游戏发行商

Fig.8 各地区销量top10的发行商

建议: Electronic Arts公司要拓展市场,应该重点考虑日本地区玩家的需求,与Nintendo进行竞争,从而扩大在日本的市场份额。

3 不同地区销量top10的游戏平台

Fig.9 各地区销量top10的游戏平台

建议:对于北美市场而言,应该考虑发展跨平台的游戏,最好能同时登录微软/任天堂/Sony平台,从而能最大化扩大受众面;而对于欧洲市场和市场结构类似的全球其他地区市场,应该重点关注Sony系平台的用户需求;对于日本市场而言应该考虑发展掌机平台游戏。

4 不同地区的游戏类型

Fig.10 各地区中意的游戏类型

建议:游戏开发者首要考虑开发运动/动作/射击类游戏来获取全球市场,而进入日本市场应该考虑开发角色扮演类游戏。

3.3 游戏发行商分析

1 历年销量最高的发行商

Fig.11 历年销量最高的发行商

2 销量top5的游戏发行商

Fig.12 销量top5游戏发行商排名
Fig.13 销量top5游戏发行商游戏发行数目变化趋势
Fig.14 销量top5游戏发行商游戏销量变化趋势

3.4 销量top10游戏平台分析

Fig.15 游戏平台销量排名top10 Fig.16 游戏平台销量变化趋势

4 总结

  1. 电子游戏市场自1980年开始发展,1995年开始进入快速发展时期,2000年后市场规模迅速过大,2009年之后游戏市场开始呈现衰退趋势。
  2. 北美和日本地区作为电子游戏的兴盛起源地,在1995年之前基本平分市场,交替成为游戏销量冠军地区,1995年后,欧洲市场稳健发展,逐步取代发展停滞的日本市场成为全球第二市场,21世纪以来保持着稳定的增长,考虑到欧洲的人口优势,未来很有可能取代北美成为第一市场。
  3. 上世纪任天堂作为游戏发行商基本稳坐销量冠军宝座,本世纪以来受到EA公司的竞争冲击,优势不再明显但仍为行业龙头。
  4. 全球市场上,索尼系游戏平台占据优势,但在北美地区和后起之秀微软分庭抗礼,在日本地区被任天堂压制;全球范围内,主机平台占据绝对优势,掌机份额持续缩减。
  5. 游戏类型上,运动/动作/射击类游戏是多数玩家的首选,但日本玩家可能受“二次元”文化影响,更钟情于角色扮演类游戏。
  6. 任天堂公司是游戏行业的领军者。作为平台商,任天堂平台游戏类型更为多元丰富;作为发行商,任天堂始终保持着业界领先的游戏素质,凭借较少的游戏发行数量和极高的平均销量,常年霸占发行商销量冠军。
  7. 游戏业呈现明显的“二八定律”,行业收入的80%集中在前25%游戏中,爆款游戏销量与次畅销游戏销量差异巨大。
上一篇 下一篇

猜你喜欢

热点阅读