Guangzhaotest
背景介绍
矩形平面安插9个监测点,每个监测点`竖直`方向安插3个传感器收集四类数据。现在有两种数据格式的数据:
1. 2023/5/10 - 2023/5/16 2023/5/10 - 2023/5/13 (为什么提供有交集的数据?可能是有个时间选取范围自动下载文件的系统) 下面的模型基准测试均是使用这个数据。
2.更大时间范围的采集数据,但是数据格式略有不同。
数据准备
一共五类数据:
虽然每个文件的时间范围20230510-20230520 但是根据时间严格对齐的数据很少,所以合并后的文件数据量会少很多,后面根据研究需要增加对齐策略。
1.以光照为主文件读取为Dataframe,将时间设置为索引,去除包含--的脏数据。重置索引,将'Time'列变为普通列,并创建新的索引'DW_Timestamp',由'DW'和'Time'组合而成。将另外三个文件的数据对齐这个主文件数据。读取excel的数据,根据结果中的'dw_timestamp'更新合并数据中的相应行,添加新的列数据。
2.合并这五个文件并按照时间排序的结果如下:
3.接下来是分割测试集、训练集进行训练