当前位置: 首页 >数据库 > FIFA2018球员数据分析---使用python进行数据分析的基本步骤

FIFA2018球员数据分析---使用python进行数据分析的基本步骤

1.明确数据分析的目的:了解FIFA2018球员整体情况

2.获得数据(一般来源于公司或网络等)

3.数据清洗(选用不同的工具,可使用excel,python,R,mysql等,本次分析使用python语言进行清洗和分析,使用的工具为jupyter notebook)

4.选择不同的维度对数据进行分析

import numpy as np import pandas as pd import matplotlib.pyplot as pltdf=pd.read_csv('./FIFA_2018_player.csv')#数据的总体描述df.describe()

FIFA2018球员数据分析---使用python进行数据分析的基本步骤 _ JavaClub全栈架构师技术笔记

#计算每列的行数,可以看出有没有null值df.count()
ID 17994name17994full_name  17994nationality17994league 17741club17741age17994birth_date 17994height_cm  17994weight_kg  17994eur_value  17994eur_wage17994dtype: int64
#获取league为null的数据df[df['league'].isnull()]#删除league为null的数据df.drop(df[df.league.isnull()].index,inplace=True)
#使用平均值填充df['eur_value'].replace(0,df['eur_value'].mean(),inplace=True)
#分析的维度和指标(平均数,最大数,最小数......)#维度:从数据选出一列或多列作为一个维度,例如国家,国家 俱乐部  离散型 和 连续型的 #离散型的维度 按照groupby 进行计算指标nationality_data=df.groupby('nationality',as_index=False).count()[['nationality','name']]nationality_data.rename(columns={'name':'player_count'},inplace=True)#按照运动员数量排名nationality_sorted_data=nationality_data.sort_values('player_count',ascending=False)#运动员数量大于100的国家列表nationality_sorted_data[nationality_sorted_data['player_count']>100]

FIFA2018球员数据分析---使用python进行数据分析的基本步骤 _ JavaClub全栈架构师技术笔记

#连续型的维度统计指标 年龄 bins=np.arange(15,50,5)#使用cut将age归为具体的组bins_data=pd.cut(df['age'],bins)#然后按照归好的组将数据进行分组,统计每组的数据bins_count=df['age'].groupby(bins_data).count()bins_count#画直方图#plt.hist(df['age'],bins)

FIFA2018球员数据分析---使用python进行数据分析的基本步骤 _ JavaClub全栈架构师技术笔记

 

#各大联赛运动员数量league_data=df.groupby('league',as_index=False).count()[['league','ID']].sort_values('ID',ascending=False)league_data.rename(columns={'ID':'player_count'},inplace=True)league_data

FIFA2018球员数据分析---使用python进行数据分析的基本步骤 _ JavaClub全栈架构师技术笔记

 

来源链接:https://www.cnblogs.com/hobelee/p/12513904.html

版权声明:
1、JavaClub(https://www.javaclub.cn)以学习交流为目的,由作者投稿、网友推荐和小编整理收藏优秀的IT技术及相关内容,包括但不限于文字、图片、音频、视频、软件、程序等,其均来自互联网,本站不享有版权,版权归原作者所有。

2、本站提供的内容仅用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯相关权利人及本网站的合法权利。
3、本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站(javaclubcn@163.com),我们将第一时间核实后及时予以删除。





本文链接:https://www.javaclub.cn/database/118248.html

标签:group by
分享给朋友:

“FIFA2018球员数据分析---使用python进行数据分析的基本步骤” 的相关文章