当前位置: 首页 > wzjs >正文

湖北省网站备案搜索关键词排行榜

湖北省网站备案,搜索关键词排行榜,网站安全维护内容,如何自己做网站发布到服务器上面【论文推荐|滑坡检测空间预测时间预测 数据驱动的分析】机器学习在滑坡研究中的最新进展与应用(2022)(七) 【论文推荐|滑坡检测空间预测时间预测 数据驱动的分析】机器学习在滑坡研究中的最新进展与应用(2022&#xf…

【论文推荐|滑坡检测·空间预测·时间预测· 数据驱动的分析】机器学习在滑坡研究中的最新进展与应用(2022)(七)

【论文推荐|滑坡检测·空间预测·时间预测· 数据驱动的分析】机器学习在滑坡研究中的最新进展与应用(2022)(七)


文章目录

  • 【论文推荐|滑坡检测·空间预测·时间预测· 数据驱动的分析】机器学习在滑坡研究中的最新进展与应用(2022)(七)
  • 4 滑坡空间预测研究综述
    • 4.1 因子分析
    • 4.2 模型构建
    • 4.3 测试与验证
        • 分类精度评估
        • 易发性分布验证


欢迎铁子们点赞、关注、收藏!
祝大家逢考必过!逢投必中!上岸上岸上岸!upupup

大多数高校硕博生毕业要求需要参加学术会议,发表EI或者SCI检索的学术论文会议论文。详细信息可关注VX “学术会议小灵通”或参考学术信息专栏:https://blog.csdn.net/2401_89898861/article/details/145551342


论文地址:https://doi.org/10.1007/s11069-022-05423-7

4 滑坡空间预测研究综述

4.1 因子分析

本阶段主要对研究区的专题信息(滑坡控制因子与滑坡清单)进行分析,并构建可用于机器学习(ML)模型的数据集。通常,为优化输入变量(特征)集,使其与输出变量(目标)相关联,本阶段采用经典统计方法。例如,Mergadi等(2020)将因子分析划分为两个步骤:从滑坡清单图与控制因子构建空间数据库;利用方差膨胀因子(VIF)与信息增益(IG)优化滑坡控制因子。类似方法亦见于其他研究,如Huang等(2020)采用频率比双变量统计分析定义输入-输出变量,Chen等(2020)则结合归一化频率比、方差膨胀因子与卡方检验进行因子分析。

在滑坡事件图构建方面,该图作为分析中的因变量,通常以二值栅格表示,其中L类单元由研究区内滑坡发生点定义,NL类单元通过随机选取无滑坡区域获得。滑坡控制因子(输入变量)可来自多源数据,如专题图、野外调查、报告及遥感影像,均需通过GIS工具处理,并转换为栅格单元值,以匹配分析分辨率数据类型可为离散或连续,在用于ML分析前,可能需要进一步预处理,例如类别变量的数值编码,或将连续变量划分为有限数量的类别。Huang等(2020)指出,若划分类别过少,控制因子的分割过于粗略;若类别过多,则建模复杂度增加。目前尚无统一标准确定最优类别数,通常参考滑坡易发性评估领域的经验法则(如Guzzetti等,1999)。在本综述涉及的七项研究中,连续变量的类别数介于3–9之间,重分类方法包括自然断点、几何间隔、频率分析及启发式评估。类别划分的主观性可能对模型结果产生重要影响。

在建模前,一些研究利用统计分析方法优化训练与验证数据集的输入变量。常见的双变量统计方法,如频率比或信息增益比,可用于评估各控制因子的预测能力,并为每个类别分配权重系数,以量化变量与滑坡发生概率之间的关系。然而,这些控制因子可能存在多重共线性,因此,需进行预检,如使用容差或方差膨胀因子评估变量间的线性相关性(Dormann等,2013)。最终,输入变量通常归一化至[0,1]范围,以提高模型稳定性。

4.2 模型构建

本阶段的首要任务是划分训练集和测试集,以用于机器学习(ML)模型的训练及其精度验证。为了评估模型的预测能力,在训练完成后,应使用独立的数据集进行测试。滑坡预测模型的验证方法主要包括:

  • (i)随机抽样建立模型,并利用剩余样本进行验证;
  • (ii)采用不同规模的随机样本训练模型,分析函数系数的显著性变化;
  • (iii)基于特定事件发生的滑坡数据构建模型,并使用后续事件触发的滑坡数据进行验证;
  • (iv)在一个训练区构建模型,并在具有相似特征的目标区域测试其适用性。

其中,第一种方法被广泛应用于滑坡易发性评估研究,通常将超过 70% 的滑坡样本用于训练,其余用于测试,以保证测试数据独立性(Gholamy et al. 2018)。在数据量充足时,可适当提高测试集比例。此外,为避免滑坡(L)与非滑坡(NL)样本比例失衡,训练和测试过程中通常随机抽取等量的 NL 样本,但此方法可能引入其他偏差。交叉验证(CV)作为一种平衡速度、精度和计算成本的方法,近年来被广泛应用于滑坡易发性 ML 研究(Mergadi et al. 2020)。

  • 目前,在区域尺度上尚无公认的最佳 ML 算法用于滑坡易发性预测,因为模型性能受算法本身、超参数调整、滑坡数据质量及环境因子的影响。

因此,大多数研究会在相同数据集上比较多个 ML 算法的表现。近年来,该领域研究数量快速增长。例如,在 Scopus 数据库(截至 2020 年 11 月 16 日)中,包含“landslide”和“machine learning”关键词的期刊论文共有 286 篇,其中 64% 研究 ML 在滑坡易发性建模中的应用。ML 研究的多样性较高,自 2010 年以来,支持向量机(SVM)、决策树(DT)和随机森林(RF)分别发表 342、247 和 179 篇相关论文(Mergadi et al. 2020)。尽管 ML 术语近年才被广泛使用,滑坡易发性预测的研究可追溯至 20 世纪 70 年代,如逻辑回归(LR)和人工神经网络(ANN)等方法在 2000 年以来分别发表 1587 和 746 篇论文(Mergadi et al. 2020)。
在这里插入图片描述

表 6 中的七项研究共采用了 23 种 ML 模型进行滑坡易发性绘制,每个研究区域对比 3 至 10 种算法(Chen et al. 2019; Mergadi et al. 2020),部分研究还对比了启发式和统计模型(Huang et al. 2020)。最常用的 ML 方法包括 SVM(5 次)、RF(4 次)、DT 和朴素贝叶斯(NB)(3 次),以及 ANN、BRT、CART、GLM 和 MLP-NN(2 次)。一些研究对多种 ML 算法进行了系统比较(Youssef et al. 2016; Pourghasemi and Rahmati 2018),另一些研究探索了混合集成方法(Pham and Prakash 2019)或较少被研究的模型(Chen et al. 2019)。深度学习神经网络(DLNN)也被引入并与 RF、SVM、DT 和 MLP-NN 进行对比(Bui et al. 2020a, b)。此外,Mergadi et al. (2020) 强调了统一的超参数优化策略对 ML 研究的重要性。

  • 模型构建的最终目标是生成滑坡易发性分布图。

计算每个像素的滑坡易发性指数后,通常采用 3 到 6 级分类(Pham and Prakash 2019; Bui et al. 2020a, b)。最常见的是 4 级(Youssef et al. 2016)或 5 级分类(Chen et al. 2019; Huang et al. 2020; Mergadi et al. 2020),如“极低”“低”“中等”“高”“极高”易发性(Fell et al. 2008)。此外,部分研究(Bui et al. 2020a, b)增加了“无易发性”类别,以涵盖易发性指数极低的区域。

4.3 测试与验证

在这里插入图片描述

滑坡易发性计算模型的性能评估可分为两个层面(表 8):

  • (1)基于二分类模型的滑坡存在/不存在结果,评估分类质量;
  • (2)验证最终生成的滑坡易发性分布图,即通过对比滑坡密度分布与已建立的滑坡编目,评估各易发性等级区域的准确性。
分类精度评估

在第一层面的测试中,常用的性能评估指标包括:

  • 混淆矩阵(CM) 相关指标,如总体准确率(Acc)、特异性(Sp)、敏感性(Se)、F1 分数(F)等;
  • 受试者工作特征曲线(ROC)下面积(AUC),通过计算不同阈值下的假阳性率和真阳性率,获得其积分值;
  • 误差评估,基于均值绝对误差(MAE)和均方根误差(RMSE)等目标函数(OF)量化分析误差;
  • Cohen’s kappa 系数(Kappa),衡量预测结果与随机一致性之间的超额一致性;
  • 可靠性图(RD)及滑坡易发性指数(LSI)分布,用于进一步评估预测模型的可靠性。

此外,在同一研究区域内对多个机器学习(ML)算法进行比较时,可采用 零假设检验(NH),如 Wilcoxon 符号秩检验(WT) 或 卡方检验(χ²),评估模型结果差异的统计显著性(表 6)。

易发性分布验证
  • 第二层面的评估基于以下假设:当滑坡易发性等级从低到高变化时,滑坡密度比应逐步增加,同时高易发性区域的空间占比应较小(Pradhan & Lee, 2010)。

为实现这一目标,需要对机器学习算法计算的滑坡发生概率进行分类,划分为不同的易发性等级,并在滑坡易发性分布图中表示。随后,可通过 充分性分析(SA) 将各易发性等级的面积分布与滑坡编目的滑坡密度进行比对,以验证预测结果。此外,还可绘制 成功率曲线(SPR) 和 预测率曲线,并计算对应的 AUC 值,以进一步量化模型性能

下节请参考:【论文推荐|滑坡检测·空间预测·时间预测· 数据驱动的分析】机器学习在滑坡研究中的最新进展与应用(2022)(八)

http://www.dtcms.com/wzjs/368593.html

相关文章:

  • 网页做二维码哪个网站好亚马逊关键词排名提升
  • 男人和男人做爰漫画网站谷歌seo关键词排名优化
  • cnzz网站建设教学网站seo链接购买
  • 国外做饮料视频网站企业网站分析报告
  • 简洁印象wordpress企业主题东莞百度推广优化排名
  • 深圳住房和建设管理局官方网站平台推广引流
  • 龙里县建设局管方网站网络营销外包网络推广
  • 网站制作 江西云优化
  • 网站制作乌鲁木齐长春网站建设模板
  • 如何建造免费的网站google中文搜索引擎
  • 自个做网站教程百度热搜榜
  • 做常识的网站接单平台
  • 西安做网站的公司有seo黑帽培训
  • outline免费服务器上海搜索引擎优化公司排名
  • 网站子页面如何做seoseo工资多少
  • 网页制作网站源码免费游戏推广平台
  • 用dedecms 做门户网站太原做推广营销
  • 网站如何增加增删查改怎么做百度提交收录入口
  • 网站开发能用到的ps知识旅游企业seo官网分析报告
  • 专业网站建设推广阿里云自助建站
  • 怎么给网站做反链网络营销的案例有哪些
  • 网站seo设置是什么百度网站流量查询
  • 郑州网站建设设计公司哪家好seo推广的特点
  • 网站介绍怎么写网站怎么做推广和宣传
  • 创业谷网站建设方案seo咨询解决方案
  • 要找做冲压件的厂去哪个网站找企业网站优化软件
  • 合肥做的比较好的网站有那几家地推平台
  • wordpress客户管理系统佛山seo教程
  • 建设个人网站的好处百度数据平台
  • 品牌营销全案seodao cn