Python的ArcPy基于Excel表格对大量遥感影像批量重分类
本文介绍基于Python中的ArcPy
模块,以Excel表格内的信息,对遥感影像加以重分类的方法。
首先,明确一下本文的需求。现有按照文章ArcPy批量将栅格文件的属性表导出为Excel表格的方法(https://blog.csdn.net/zhebushibiaoshifu/article/details/146456864)中方法,从大量遥感影像中导出的栅格数据属性表,其均为.csv
格式的表格文件。以其中一个.csv
格式文件为例,其数据信息如下图所示。
其中,.csv
文件的VALUE
列表示遥感影像原本的像素值;而我们希望,将每一个像素,由原本的值(VALUE
列)重分类为上图中mvalue
列表示的值——例如,如果原本像素为1
,那么将其重分类为123000
。此外,还需要注意,对于mvalue
列,如果其原本的数字位数不够6
位,则在其右侧补0
直至满6
位——例如,如果mvalue
列原本的值为23
,那么需要在重分类时,重分类为230000
。
明确了需求,我们就可以开始撰写代码。本文所用代码如下。
# -*- coding: utf-8 -*-import arcpy
import os
import pandas as pd
from arcpy.sa import *tif_folder = r'E:/06_Extra/202503_SC/TIFF/'
csv_folder = r'E:/06_Extra/202503_SC/Re/'
output_folder = r'E:/06_Extra/202503_SC/ReTIFF2/'def format_value(val):"""确保 mvalue 值为6位,在右侧补0"""if val == "":return Nonetry:# 确保是整数,并转换为字符串str_val = str(int(val))# 计算需要补充的0的数量padding_length = 6 - len(str_val)if padding_length > 0:# 在右侧填充0formatted_val = str_val + '0' * padding_lengthelse:# 如果已经是或超过6位,则直接返回formatted_val = str_valreturn int(formatted_val)except ValueError:return Nonetif_files = [f for f in os.listdir(tif_folder) if f.endswith('.tif')]for tif_file in tif_files:tif_path = os.path.join(tif_folder, tif_file)print(tif_path)csv_file = tif_file.replace('.tif', '.tif.csv')csv_path = os.path.join(csv_folder, csv_file)print(csv_path)df = pd.read_csv(csv_path)df = df.dropna(subset=['mvalue'])df['mvalue'] = df['mvalue'].apply(format_value)df = df.dropna(subset=['mvalue']) # 再次删除格式化后可能产生的NaN值if df.empty:print("No valid data found in {}, skipping.".format(csv_file))continuereclass_rules = []for index, row in df.iterrows():value = int(row['Value'])mvalue = int(row['mvalue'])print(mvalue) # 打印格式化后的 mvalue 值reclass_rules.append((value, mvalue))myRemapValue = RemapValue(reclass_rules)reclass_table = arcpy.sa.Reclassify(tif_path, "Value", myRemapValue, "NODATA")# 输出路径output_path = os.path.join(output_folder, tif_file)# 保存重分类后的栅格数据reclass_table.save(output_path)print("Batch processing completed.")
其中,代码整体思路也很简单。
首先,tif_folder
是存储.tif
格式栅格图像文件的路径,csv_folder
是存储与每个.tif
文件对应的.csv
文件的路径,也就是包含重分类规则的Excel文件的路径;output_folder
则是用于保存处理后的重分类结果(也是.tif
文件)的路径。
随后,format_value
函数接收一个数值val
,将其转换成字符串,并保证长度为6
位;如果不足6
位,则在右侧填充0
,如果输入为空或无效值,则返回None
。
接下来,列出tif_folder
目录下所有以.tif
结尾的文件名,并循环遍历每一个文件——首先构建当前.tif
文件的完整路径,随后查找对应的.csv
文件(同名但扩展名为.tif.csv
的文件);使用Pandas读取.csv
文件,删除mvalue
列中为空的行,对mvalue
列应用上面定义的format_value
函数进行格式化;随后,再次删除格式化失败导致的空值;如果处理后没有有效数据,跳过该文件。
紧接着,遍历DataFrame的每一行,提取Value
和格式化后的mvalue
,将它们构造成一个元组(原值, 新值)
,存入reclass_rules
列表。随后,使用arcpy.sa.RemapValue()
创建一个映射规则对象,并调用arcpy.sa.Reclassify()
进行重分类——输入栅格为tif_path
,按照像素值Value
进行重分类(应用myRemapValue
规则),且未匹配的像素设为NODATA
。
最后,构建输出路径,并保存重分类后的栅格图像到指定位置。处理完所有文件后打印完成信息。
执行上述代码,即可对每一个遥感影像,按照每一个Excel文件内的规则,加以重分类。
至此,大功告成。
欢迎关注:疯狂学习GIS