当前位置: 首页 > wzjs >正文

重庆网站建站建设的费用线上培训平台

重庆网站建站建设的费用,线上培训平台,北京网站开发浩森宇特,汕头网站建设只需要800文章目录 前言一、遍历1.行遍历2.列遍历3.直接遍历 二、排序三、去重四、分组 前言 通过今天的学习,我掌握了对Pandas的数据类型进行基本操作,包括遍历,去重,排序,分组 一、遍历 1.行遍历 intertuples方法用于遍历D…

文章目录

  • 前言
  • 一、遍历
    • 1.行遍历
    • 2.列遍历
    • 3.直接遍历
  • 二、排序
  • 三、去重
  • 四、分组


前言

通过今天的学习,我掌握了对Pandas的数据类型进行基本操作,包括遍历,去重,排序,分组


一、遍历

1.行遍历

  • intertuples方法用于遍历Dataframe的行,返回包含行数据及命名的元组
data = {'A': [1, 2, 3],'B': [4, 5, 6],'C': [7, 8, 9]
}
df = pd.DataFrame(data, index=['a', 'b', 'c'])# 使用 itertuples() 遍历行
for row in df.itertuples(index=False): #如果index为False,则结果过滤行索引信息print(row)for i in row:print(i)

tips:可以指定index参数,用于控制是否返回行索引信息

2.列遍历

  • items方法用于遍历Dataframe的列,返回包括列名和列数据的迭代器
data = {'A': [1, 2, 3],'B': [4, 5, 6],'C': [7, 8, 9]
}
df = pd.DataFrame(data, index=['a', 'b', 'c'])# 使用 items() 遍历列
for column_name, column_data in df.items():print(f"Column Name: {column_name}, Column Data: {column_data}")

3.直接遍历

  • 使用index,columns属性进行遍历
data = {'A': [1, 2, 3],'B': [4, 5, 6],'C': [7, 8, 9]
}
df = pd.DataFrame(data, index=['a', 'b', 'c'])for idx in df.index:for col in df.columns:print(df.loc[idx,col])

二、排序

  • sort_values方法用于对Dataframe进行排序
  • DataFrame.sort_values(by, axis=0, ascending=True, inplace=False, kind=‘quicksort’, na_position=‘last’)
  • by:列的标签或列的标签列表。指定要排序的列
  • ascending:布尔值或布尔值列表,指定是升序排序(True)还是降序排序(False)。可以为每个列指定不同的排序方向。
data = {'A': [3, 2, 1],'B': [6, 5, 4],'C': [9, 8, 7]
}
df = pd.DataFrame(data, index=['b', 'c', 'a'])df_sorted = df.sort_values(by='A',ascending=False)
print(df_sorted)df = pd.DataFrame({'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],'Age': [25, 30, 25, 35, 30],'Score': [85, 90, 80, 95, 88]
})
# 如果列中存在相同的值,可以指定两个列进行排序
df_sorted = df.sort_values(by=['Age', 'Score'], ascending=[False, True])
print(df_sorted)

三、去重

  • drop_duplicates方法用于删除重复行或元素
  • drop_duplicates(by=None, subset=None, keep=‘first’, inplace=False)
  • keep:指定如何处理重复项
  • by:用于标识重复项的列名或列名列表
data = {'A': [1, 2, 2, 3],'B': [4, 5, 5, 6],'C': [7, 8, 8, 9]
}
df = pd.DataFrame(data)# 删除所有列的重复行,默认保留第一个出现的重复项
df_unique = df.drop_duplicates()
print(df_unique)# 删除重复行,保留最后一个出现的重复项
df_unique = df.drop_duplicates(keep='last')
print(df_unique)# 删除所有重复项
df_unique = df.drop_duplicates(keep=False)
print(df_unique)

四、分组

  • groupby方法用于对数据进行分组
  • DataFrame.groupby(by, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, observed=False, **kwargs)
  • by:指定分组的列名
data = {'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],'C': [1, 2, 3, 4, 5, 6, 7, 8],'D': [10, 20, 30, 40, 50, 60, 70, 80]}
df = pd.DataFrame(data)# 按列'A'分组,返回一个对象
grouped = df.groupby('A')# 查看分组结果
for name, group in grouped:print(f"Group: {name}")print(group)print()mean = df.select_dtypes(include='number').groupby(df['A']).mean()
print(mean)
mean = df.groupby("A")["D"].mean() #如果不指定列,会计算所有列的均值
print(mean)# transform用于在分组操作中对每个组内的数据进行转换,并将结果合并回原始 DataFrame
mean = df.groupby("A")["D"].transform(lambda x: x.mean())
# print(mean)
df['C_mean'] = mean
print(df)

THE END

http://www.dtcms.com/wzjs/528434.html

相关文章:

  • 网站编辑心得体会电商网页
  • 做电影网站解析某产品网络营销推广方案
  • 香港机房 经营性网站代发百度关键词排名
  • 哈尔滨网站空间网站运营需要多少钱
  • 云平台网站建设网推是干什么的
  • 注册过什么网站百度关键词搜索量排行
  • vs2012 网站开发如何查询域名注册人信息
  • 沈阳网站备案查询青岛网站
  • 网站建设微信营销公司怎样做网站推广
  • wordpress重置密码云南seo简单整站优化
  • 江山做网站阳江网站建设
  • 衡阳做网站优化南京seo排名优化公司
  • 做灯箱片的设计网站百度蜘蛛池自动收录seo
  • 嘉兴 网站 制作seo点击软件排名优化
  • 佛山的网站建设公司做百度推广的网络公司广州
  • 一个做礼品的网站外贸网站建设设计方案
  • 广南网站建设培训班招生方案有哪些
  • oss cdn wordpress网站优化推广培训
  • 王爷站住重生嫡女要强嫁怎么做网站关键词优化
  • 柳州做网站哪家好网络营销的工作内容包括哪些
  • 网站友情链接怎么做百度sem认证
  • 软装潢.企业网站建设网络营销的六大特征
  • 购物网站名字百度电话
  • 尼尔的h版是那个网站做的建站系统软件有哪些
  • 网站建设联系电话杭州seo软件
  • .net php开发网站开发目前最流行的拓客方法
  • 广州外包公司都有哪些就业seo好还是sem
  • 惠州企业建站程序软文编辑
  • 百度h5发布台州seo网站排名优化
  • 如何自己做网站优化深圳电子网络推广查询