【Python】家庭用电数据的时序分析
Household Electricity Consumption | Kaggle
目录
数据简介
探索分析
数据清洗
用电占比
趋势分析
序列分解
周期分析
周期分解
分析小结
数据简介
240000-household-electricity-consumption-records数据集包含了一个家庭6个月的用电数据,收集于2007年1月至2007年6月。这些数据包括总有功功率、总无功功率、电压、全球强度、分项计量1(厨房)、分项计量2(洗衣房)和分项计量3(电热水器和空调)等信息。该数据集共有260,640个测量值。
| 列名 | 说明 |
|---|---|
| Date | 日期 |
| Time | 时间 |
| Globalactivepower | 该家庭所消耗的总有功功率(千瓦) |
| Globalreactivepower | 该家庭消耗的总无功功率(千瓦) |
| Voltage | 向家庭输送电力的电压(伏特) |
| Global_intensity | 输送到家庭的平均电流强度(安培) |
| Submetering1 | 厨房消耗的有功功率(千瓦) |
| Submetering2 | 洗衣房所消耗的有功功率(千瓦) |
| Submetering3 | 电热水器和空调所消耗的有功功率(千瓦) |
有功功率:对外做功,保持用电设备正常运行的电功率。
无功功率:不对外做功,形成和维持设备磁场的电功率。
探索分析
导入数据集并读取头部
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
data_path = "./household_power_consumption.csv"
df = pd.read_csv(data_path,index_col='index')
df.head()

列名替换为中文
df.rename(columns={'Date': '日期','Time': '时间','Global_active_power': '有功功率','Global_reactive_power': '无功功率','Voltage': '电压','Global_intensity': '电流','Sub_metering_1': '厨房的有功功率','Sub_metering_2': '洗衣房的有功功率','Sub_metering_3': '电热水器和空调的有功功率',},inplace=1)
# 再次预览前5行数据
df.head()

查看数据信息
df.info()

查看数据类型
df.dtypes
