当前位置: 首页 > wzjs >正文

做淘推广的网站做外贸如何建网站

做淘推广的网站,做外贸如何建网站,旅游网站建设的相关报价,老板办公室装修设计一、数据展示 1.1、数据 1.2、列名 字段名备注Name姓名Nationality国籍National_Position国家队位置National_Kit国家队号码Club所在俱乐部Club_Position所在俱乐部位置Club_Kit俱乐部号码Club_Joining加入俱乐部时间Contract_Expiry合同到期时间Rating评分Height身高Weight体…

一、数据展示

1.1、数据

1.2、列名

字段名备注
Name姓名
Nationality国籍
National_Position国家队位置
National_Kit国家队号码
Club所在俱乐部
Club_Position所在俱乐部位置
Club_Kit俱乐部号码
Club_Joining加入俱乐部时间
Contract_Expiry合同到期时间
Rating评分
Height身高
Weight体重
Preffered_Foot擅长左(右)脚
Birth_Date出生日期
Age年龄
Preffered_Position擅长位置
Work_Rate工作效率
Weak_foot非惯用脚使用频率
Skill_Moves技术等级
Ball_Control控球技术
Dribbling盘球(带球)能力
Marking盯人能力
Sliding_Tackle铲球
Standing_Tackle逼抢能力
Aggression攻击能力
Reactions反映
Attacking_Position攻击性跑位
Interceptions抢断
Vision视野
Composure镇静
Crossing下底传中
Short_Pass短传
Long_Pass长传
Acceleration加速度
Speed速度
Stamina体力
Strength强壮
Balance平衡
Agility敏捷度
Jumping跳跃
Heading投球
Shot_Power射门力量
Finishing射门
Long_Shots远射
Curve弧线
Freekick_Accuracy任意球精准度
Penalties点球
Volleys凌空能力
GK_Positioning门将位置感
GK_Diving扑救能力
GK_Kicking门将踢球能力
GK_Handling扑球脱手几率
GK_Reflexes门将反应度

二、加载数据

2.1、加载足球运动员数据

import numpy as np
import pandas as pd
import matplotlib.pyplot as pltdf = pd.read_csv('FullData.csv')

2.2、设置中文和负数不显示问题

plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

三、数据清洗

3.1、缺值处理

3.1.1、查看缺失值

df.info()

 

从上述示例可以看到总共17588行,但National_Position(国家队位置) 是1075行,Club_Position (俱乐部位置)17587行。我们知道有的足球运动员是没有进入国家队的,所以National_Position缺值是正常情况。但Club_Position缺值需要处理。 

3.1.2、显示缺失值的数据

df[df['所在俱乐部位置'].isna()]

或 

df[df['所在俱乐部位置'].notna()]

 3.1.3、获取未缺失值的数据

df2 = df[~df['所在俱乐部位置'].isna()]

或 

df2 = df[df['所在俱乐部位置'].notna()]

 或 

df2 = df[df['所在俱乐部位置'].notnull()]

3.2、异常值处理

3.2.1、数据描述统计信息 

describe方法得到数据的描述性统计信息,比如max min,mean,std进行异常值分析

df2.describe()

 3.2.2、使用箱线图辅助查看异常值

df2.boxplot(column='评分')
plt.show()

 

3.3、重复值处理

3.3.1、查看重复数据

df.duplicated().any()

3.3.2、查看没有重复的数据

df[~df.duplicated()]

3.3.3、删除重复的数据

df.drop_duplicates()

3.3.4、指定列重复才删除

df.drop_duplicates(subset=['姓名'])

3.3.5、替换原有的df数据

df.drop_duplicates(inplace=True)

四、数据可视化

4.1、运动员的体重分布情况

从查看数据结果可以看到运动员身高Height、体重Weight的数据后都添加了相应的单位。要分析运动员身高和体重的分布,首先需要将身高Height和Weight数据的单位去掉。

 4.1.1、身高与体重处理

4.1.1.1、通过字符串的替换
df3['身高']=df3['身高'].str.replace('cm','').astype('int')
df3['体重']=df3['体重'].str.replace('kg','').astype('int')
4.1.1.2、通过apply方式
def handle_cm(v:str)-> int:return int(v.replace('cm',''))
def handle_kg(v:str)-> int:return int(v.replace('kg',''))
4.1.1.3、使用匿名函数的方式 lambda
df3['身高'].apply(lambda x:int(x.replace('cm','')))
df3['体重'].apply(lambda x:int(x.replace('kg','')))

4.1.2、 查看身高体重_数据分布情况

df3[['身高','体重']].describe()

直方图 
plt.hist(df3['身高'],bins=20)
plt.title('身高')
plt.show()

plt.hist(df3['体重'],bins=20)
plt.title('体重')
plt.show()
画密度图 
df3['身高'].plot(kind='kde')
plt.title('身高')
plt.show()

 

df3['体重'].plot(kind='kde')
plt.title('体重')
plt.show()

4.2、使用左右脚分析

4.2.1、使用饼状图来显示

df3['擅长左(右)脚'].value_counts().plot(kind='pie',autopct='%.2f%%',fontsize=16)
plt.legend()
plt.show()

4.2.2、value_counts()方法

df3['擅长左(右)脚'].value_counts()

4.2.3、 使用条形图

df3['擅长左(右)脚'].value_counts().plot(kind='bar')
plt.show()

4.3、俱乐部评分分析

4.3.1、获取前10的 俱乐部,根据球员的评分

dfg1=df3.groupby('所在俱乐部')
dfg1['评分'].mean().sort_values(ascending=False).head()

4.3.2、对俱乐部人数大于25人的俱乐部,平均评分进行排序取前10

# 查看俱乐部的球员人数,球员的平均分
rs1 = dfg1['评分'].agg(['mean','count'])
# 查看俱乐部的球员人数,球员的平均分,过滤掉人数小于25
rs1['count']>=25
# 查看俱乐部的球员人数,球员的平均分,过滤掉人数小于25,排名前10的俱乐部
rs1[rs1['count']>=25].sort_values(by='mean',ascending=False).head(10)
# 根据排名进行绘制图表
rs1[rs1['count']>=25].sort_values(by='mean',ascending=False).head(10).plot(kind='bar')

4.4、运动员与出生日期是否相关

4.4.1、获取足球运动员出生日期

data=df3['出生日期'].str.split('/',expand=True)

观察出生年和足球运动员数量关系

data['年'].value_counts().plot()
plt.xlabel('年')
plt.show()

观察出生月和足球运动员数量关系 

data['月'].value_counts().plot()
plt.xlabel('月')
plt.show()

 观察出生日和足球运动员数量关系 

data['日'].value_counts().plot()
plt.xlabel('日')
plt.show()

4.4.2、评分大于等于80与出生日期关系

df4=df3[df3['评分']>80]
data2=df4['出生日期'].str.split('/',expand=True)
data2.columns = ['月', '日', '年']  

 观察出生年和足球运动员数量关系

data2['年'].value_counts().plot()
plt.xlabel('年')
plt.show()

观察出生月和足球运动员数量关系 

data2['月'].value_counts().plot()
plt.xlabel('月')
plt.show()

 观察出生日和足球运动员数量关系 

data2['日'].value_counts().plot()
plt.xlabel('日')
plt.show()

4.5、身高与体重相关性

df3.plot(kind='scatter',x='身高',y='体重')
plt.show()

df3['身高'].corr(df3['体重'])

 corr查看相关性

np.float64(0.7582641987537077)

4.6、年龄与评分相关性

df3['age']=pd.cut(df3['年龄'],bins=4,labels=['青年','中年','壮年','老年'])
df3.groupby('age')['评分'].mean().plot()
plt.show()

 

4.7、分析数据之间的相关性 

df3.select_dtypes(include=['number']).corr()

查看哪些数据与评分相关性较强,得出前五名

df3.select_dtypes(include=['number']).corr()['评分'].sort_values(ascending=False).head(5)


文章转载自:

http://OorfpUxq.fwbLh.cn
http://R0ftsWkB.fwbLh.cn
http://SlfG1aiH.fwbLh.cn
http://quFEDSN2.fwbLh.cn
http://3V7EFbt0.fwbLh.cn
http://4Da4mbk9.fwbLh.cn
http://5yT1txxP.fwbLh.cn
http://2n8VQHFc.fwbLh.cn
http://neyAD50G.fwbLh.cn
http://kVSirXAx.fwbLh.cn
http://mKCCoDn7.fwbLh.cn
http://ex1DQE3Q.fwbLh.cn
http://Uaue0aPh.fwbLh.cn
http://EORTexLh.fwbLh.cn
http://2Mvx7SAE.fwbLh.cn
http://bRHkxqZh.fwbLh.cn
http://NC8FJvCv.fwbLh.cn
http://x9MeUh6L.fwbLh.cn
http://iDrQF3Zq.fwbLh.cn
http://7BQ3ZQ5q.fwbLh.cn
http://AzlYi8H4.fwbLh.cn
http://JkxDqThR.fwbLh.cn
http://pFkFmpZ9.fwbLh.cn
http://guwlenkq.fwbLh.cn
http://BRTEvK5d.fwbLh.cn
http://gaw0q2dB.fwbLh.cn
http://DN2tnb8V.fwbLh.cn
http://DGAXBcZI.fwbLh.cn
http://mCQwvhgE.fwbLh.cn
http://MJPT1xFl.fwbLh.cn
http://www.dtcms.com/wzjs/764532.html

相关文章:

  • 用局域网建设网站企业网站推广哪个公司好
  • 网站开发的工作职责复刻手表网站
  • 上海网站设计公司企业网站seo优帮云
  • dede网站地图模板上海专业制作网站
  • 怎么做一网站首页wordpress 全文检索
  • 网站开发 q3687474网店卖什么最赚钱
  • 建设网站公司哪里好提供网站建设报价
  • 小说网站开发多少钱今天深圳新增确诊最新消息
  • 谷歌网站推广方案可以看辽宁经济频道的app
  • 判断网站开发语言广东建筑信息平台
  • 山东做网站公司阿里云 备案 网站服务内容
  • 微信网站开发公司电话微信如何绑定网站
  • app应用网站单页模板下载视觉比较好看的网站
  • 好看的手机网站模板免费下载呼伦贝尔网站建设公司
  • 访问不了网站目录中的网页做网站的网站源码
  • 哪家公司做移动网站增城企业网站建设
  • 网站建设周末培训国内设计公司前十名
  • 建设银行网站能不能注销卡广告建设网站
  • 建站哪家好wordpress国家商标注册查询网官网
  • 婚恋网站女代我做彩票上海建筑信息平台
  • 电商网站设计实训总结报告网页视频在线提取
  • 产品服务展示型网站有哪些个人网站制作体会
  • 贵州网站推广电话中国建筑设计研究院官网
  • iis6cgi php网站缓存网站建设提案
  • 潜江做网站哪家好免费网站建设网站有那些
  • 网站的结构包括哪些内容seo课程
  • 蒙文网站建设的意义黎平网站开发
  • 做健身俱乐部网站的目的和意义学大教育培训机构怎么样
  • 网站建设在360属于什么类目深圳服务网站入口
  • 网站需要哪些中国有没有一家做茶叶的网站