当前位置: 首页 > wzjs >正文

商城网站建设 数商云搜狗站长推送工具

商城网站建设 数商云,搜狗站长推送工具,网站快速建设软件下载,深圳市网站建设公司这里写自定义目录标题 动机代码1,这个代码是有问题的代码2,这个代码是我调试代码。拆分代码,最后找到问题所在,这个代码是正确的代码3。本以为找到问题所在之后,又稍微修改了下代码 2,这个代码还是没问题的…

这里写自定义目录标题

  • 动机
    • 代码1,这个代码是有问题的
    • 代码2,这个代码是我调试代码。拆分代码,最后找到问题所在,这个代码是正确的
    • 代码3。本以为找到问题所在之后,又稍微修改了下代码 2,这个代码还是没问题的
    • 代码4。本以为找到问题所在之后,又稍微修改了下代码 1,这个代码还是没问题的

动机

今天写代码,处理通量站数据的时候出错。代码逻辑没问题,但是就是得不到想要的结果,然后做个笔记。可能问题是我自己遇到的,在这里其他人也没经历,所以也看不懂。总体而言:Pandas:从一个DataFrame中直接索引赋值到另一个索引位置出错。必须使用一个中间变量去固定。虽然解决了问题,好像还是不知道为什么。我尝试过换python 版本(3.7 和 3.10),但是没用。

代码1,这个代码是有问题的

import pandas as pd
import numpy as np# 假设 siteData_reindexed 是你的 DataFrame
# 这里是一个示例 DataFrame
# siteData_reindexed = pd.DataFrame({
#     'SW_IN': [np.nan, 1, 2, np.nan, 4, np.nan, 6, 7, 8, 9, 10, np.nan],
#     'LW_IN': [1, 2, np.nan, 4, np.nan, 6, 7, np.nan, 9, 10, np.nan, 12],
#     'WS': [5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16]
# }, index=pd.date_range(start="2019-06-26 14:00:00", end="2020-11-17 10:00:00", freq='60min'))# 计算每天的缺失值比例
rad_daily_miss_rate = siteData_reindexed[["SW_IN", "LW_IN"]].resample('D').apply(lambda x: x.isnull().mean())# 创建一个新的 DataFrame 来存储填补后的数据
filled_data = siteData_reindexed.copy()# 遍历每天的缺失值比例
for date, ratios in rad_daily_miss_rate.iterrows():print("##" * 30)sw_in_ratio = ratios['SW_IN']lw_in_ratio = ratios['LW_IN']print(date, sw_in_ratio, lw_in_ratio)print("前:")print(filled_data.loc[date - pd.Timedelta(hours=1): date + pd.Timedelta(hours=23), ["SW_IN", "LW_IN"]])# 检查缺失比例if sw_in_ratio == 0 and lw_in_ratio == 0:print("没有参加填补")# 如果缺失比例为0,什么都不做continueelif sw_in_ratio < 0.4 and lw_in_ratio < 0.4:# 如果缺失比例小于40%,使用 .ffill() 和 .bfill() 填补当天的 'SW_IN' 和 'LW_IN'filled_data.loc[date:date + pd.Timedelta(hours=23), ['SW_IN', 'LW_IN']] = filled_data.loc[date:date + pd.Timedelta(hours=23), ['SW_IN', 'LW_IN']].ffill().bfill()else:# 否则,使用前一天的24小时数据填补 'SW_IN' 和 'LW_IN'previous_day = date - pd.Timedelta(days=1)if previous_day in filled_data.index:print(f"填补前一天的数据: {previous_day}")print(filled_data.loc[previous_day:previous_day + pd.Timedelta(hours=23), ['SW_IN', 'LW_IN']])# 这里就是问题所在的位置filled_data.loc[date:date + pd.Timedelta(hours=23), ['SW_IN', 'LW_IN']] = filled_data.loc[previous_day:previous_day + pd.Timedelta(hours=23), ['SW_IN', 'LW_IN']]else:print(f"前一天 {previous_day} 的数据不存在")print("后:")print(filled_data.loc[date - pd.Timedelta(hours=1): date + pd.Timedelta(hours=23), ["SW_IN", "LW_IN"]])# 结果
# print(filled_data)

问题出在这里 filled_data.loc[date:date + pd.Timedelta(hours=23), ['SW_IN', 'LW_IN']] = filled_data.loc[previous_day:previous_day + pd.Timedelta(hours=23), ['SW_IN', 'LW_IN']]。必须使用一个中间变量去将数值固定,否则在内存中索引,会匹配错误。我是这么理解的。可能也是我写代码习惯不太好。

代码2,这个代码是我调试代码。拆分代码,最后找到问题所在,这个代码是正确的

""""""# 计算每天的缺失值比例
rad_daily_miss_rate = siteData_reindexed[["SW_IN","LW_IN"]].resample('D').apply(lambda x: x.isnull().mean())# 创建一个新的 DataFrame 来存储填补后的数据
filled_data= siteData_reindexed.copy()# 遍历每天的缺失值比例
for date, ratios in rad_daily_miss_rate.iterrows():if date <= pd.Timestamp("2019-06-29 23:00:00") :sw_in_ratio = ratios['SW_IN']lw_in_ratio = ratios['LW_IN']# 检查缺失比例if sw_in_ratio == 0 and lw_in_ratio == 0:print("没有参加填补")# 如果缺失比例为0,什么都不做continueelif sw_in_ratio < 0.4 and lw_in_ratio < 0.4:print("进入  sw_in_ratio < 0.4 and lw_in_ratio < 0.4 ")# 如果缺失比例小于30%,使用 .ffill() 和 .bfill() 填补当天的 'SW_IN' 和 'LW_IN'filled_data.loc[date:date + pd.Timedelta(hours=23), ['SW_IN', 'LW_IN']] = filled_data.loc[date:date + pd.Timedelta(hours=23), ['SW_IN', 'LW_IN']].ffill().bfill()else:print("进入 else")# 否则,使用前一天的24小时数据填补 'SW_IN' 和 'LW_IN'# 这个放置位置的索引timeRange = pd.date_range(start= date, end=date + pd.Timedelta(days=1), freq='60min')for date_index in timeRange:# 确保匹配到的是前一天的数据print(f"date_index: {date_index}")# 必须使用一个中间变量去将数值固定,否则在内存中索引,会匹配错误previous_day_value = siteData_reindexed.loc[date_index - pd.Timedelta(days=1), ['SW_IN', 'LW_IN']]print(f"前一天数据: {previous_day_value}")# 检查是否能成功填充filled_data.loc[date_index, ['SW_IN', 'LW_IN']] = previous_day_valueprint(f"填补后的数据: {filled_data.loc[date_index, ['SW_IN', 'LW_IN']]}")print("后:")print(filled_data.loc[date:date + pd.Timedelta(hours=23),["SW_IN","LW_IN"]])
# 结果
# print(filled_data)

代码3。本以为找到问题所在之后,又稍微修改了下代码 2,这个代码还是没问题的

""""""# 计算每天的缺失值比例
rad_daily_miss_rate = siteData_reindexed[["SW_IN","LW_IN"]].resample('D').apply(lambda x: x.isnull().mean())# 创建一个新的 DataFrame 来存储填补后的数据
filled_data= siteData_reindexed.copy()# 遍历每天的缺失值比例
for date, ratios in rad_daily_miss_rate.iterrows():if date <= pd.Timestamp("2019-06-29 23:00:00") :sw_in_ratio = ratios['SW_IN']lw_in_ratio = ratios['LW_IN']# 检查缺失比例if sw_in_ratio == 0 and lw_in_ratio == 0:print("没有参加填补")# 如果缺失比例为0,什么都不做continueelif sw_in_ratio < 0.4 and lw_in_ratio < 0.4:print("进入  sw_in_ratio < 0.4 and lw_in_ratio < 0.4 ")# 如果缺失比例小于30%,使用 .ffill() 和 .bfill() 填补当天的 'SW_IN' 和 'LW_IN'filled_data.loc[date:date + pd.Timedelta(days=1), ['SW_IN', 'LW_IN']] = filled_data.loc[date:date + pd.Timedelta(hours=23), ['SW_IN', 'LW_IN']].ffill().bfill()else:print("进入 else")# 否则,使用前一天的24小时数据填补 'SW_IN' 和 'LW_IN'# 变量前一天previous_day = date - pd.Timedelta(days=1)# 前一天的数据previous_day_data = siteData_reindexed.copy().loc[previous_day:date, ['SW_IN', 'LW_IN']]filled_data.loc[date:date + pd.Timedelta(days=1), ['SW_IN', 'LW_IN']] = previous_day_data# 这个放置位置的索引# timeRange = pd.date_range(start= date, end=date + pd.Timedelta(days=1), freq='60min')# for date_index in timeRange:##     # 确保匹配到的是前一天的数据#     print(f"date_index: {date_index}")#     # 必须使用一个中间变量去将数值固定,否则在内存中索引,会匹配错误#     previous_day_value = siteData_reindexed.loc[date_index - pd.Timedelta(days=1), ['SW_IN', 'LW_IN']]#     print(f"前一天数据: {previous_day_value}")##     # 检查是否能成功填充#     filled_data.loc[date_index, ['SW_IN', 'LW_IN']] = previous_day_value#     print(f"填补后的数据: {filled_data.loc[date_index, ['SW_IN', 'LW_IN']]}")print("后:")print(filled_data.loc[date:date + pd.Timedelta(hours=23),["SW_IN","LW_IN"]])
# 结果
# print(filled_data)

代码4。本以为找到问题所在之后,又稍微修改了下代码 1,这个代码还是没问题的

import pandas as pd
import numpy as np# 创建一个示例 DataFrame
data = {'SW_IN': [np.nan, 1, 2, np.nan, 4, np.nan, 6, 7, 8, 9, 10, np.nan],'LW_IN': [1, 2, np.nan, 4, np.nan, 6, 7, np.nan, 9, 10, np.nan, 12],'WS': [5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16]
}
index = pd.date_range(start="2019-06-26 14:00:00", end="2020-11-17 10:00:00", freq='60min')
siteData_reindexed = pd.DataFrame(data, index=index)# 计算每天的缺失值比例
rad_daily_miss_rate = siteData_reindexed[["SW_IN", "LW_IN"]].resample('D').apply(lambda x: x.isnull().mean())# 创建一个新的 DataFrame 来存储填补后的数据
filled_data = siteData_reindexed.copy()# 遍历每天的缺失值比例
for date, ratios in rad_daily_miss_rate.iterrows():print("##" * 30)sw_in_ratio = ratios['SW_IN']lw_in_ratio = ratios['LW_IN']print(date, sw_in_ratio, lw_in_ratio)print("前:")print(filled_data.loc[date - pd.Timedelta(hours=1): date + pd.Timedelta(hours=23), ["SW_IN", "LW_IN"]])# 检查缺失比例if sw_in_ratio == 0 and lw_in_ratio == 0:print("没有参加填补")continueelif sw_in_ratio < 0.4 and lw_in_ratio < 0.4:# 填补当天的缺失值filled_data.loc[date:date + pd.Timedelta(hours=23), ['SW_IN', 'LW_IN']] = filled_data.loc[date:date + pd.Timedelta(hours=23), ['SW_IN', 'LW_IN']].ffill().bfill()else:# 使用前一天的24小时数据填补previous_day = date - pd.Timedelta(days=1)if previous_day in filled_data.index:print(f"填补前一天的数据: {previous_day}")previous_data = filled_data.loc[previous_day:previous_day + pd.Timedelta(hours=23), ['SW_IN', 'LW_IN']]print("前一天的数据:")print(previous_data)# 确保赋值的索引对齐filled_data.loc[date:date + pd.Timedelta(hours=23), ['SW_IN', 'LW_IN']] = previous_data.copy()else:print(f"前一天 {previous_day} 的数据不存在")print("后:")print(filled_data.loc[date - pd.Timedelta(hours=1): date + pd.Timedelta(hours=23), ["SW_IN", "LW_IN"]])# 结果
# print(filled_data)
http://www.dtcms.com/wzjs/424979.html

相关文章:

  • 泰安市建设信息网站武汉网站设计公司
  • 网站内容是什么百度推广落地页
  • 瑞金市网站建设宁波网站优化公司推荐
  • 网站开发的趋势信息流广告推广
  • 南通做网站南昌seo管理
  • 发外链的论坛网站公司网站
  • 个人网站建设大全谷歌浏览器 安卓下载
  • 沈阳网站建设哪家公司好seo网站推广推荐
  • 网站没有做实名认证网站怎么找
  • 新零售商业模式搜索引擎优化公司
  • 企业主体负责人和网站负责人seo外推软件
  • 化妆品网站建设的维护电商运营培训课程有哪些
  • 政府网站建设专业公司海南网站制作公司
  • Wordpress本地打开就很慢网站优化网站
  • 备案个人网站广东企业网站seo报价
  • 免费做抽奖的h5网站合肥百度关键词排名
  • 企业网站怎么管理系统seo优化报价公司
  • 化州市建设局网站怎么找平台推广自己的产品
  • 监控设备东莞网站建设b站刺激战场视频
  • 展览网站模板百度推广的渠道有哪些
  • seo做网站seo是哪个英文的简写
  • 广州有哪些科技公司重庆seo扣费
  • https部署 wordpressseo 什么意思
  • 潮汕美食网站怎么做网络服务网络推广
  • 易企互联网站建设正规电商培训学校排名
  • 虚拟币交易网站建设一手app推广接单平台
  • 江都城乡建设局网站seo交流论坛
  • 平台网站如何做推广方案设计怎么优化网站
  • 网站建设策划书提纲郑州seo优化顾问
  • 苏州建筑行业网站建设如何开发软件app