当前位置: 首页 > news >正文

偏最小二乘结构方程(PLS-SEM)_TomatoSCI分析日记

之前我们介绍过基于贝叶斯网络的结构方程,适用于数据驱动的因果探索。然而,当数据中包含潜变量(即由多个观测指标组合而成的综合概念)时,贝叶斯结构方程不太适用。这时,PLS-SEM能够很好地填补这一空白。PLS-SEM 的特点主要有两点:

①容许潜变量存在,可以将多个观测指标分类整合,简化数据结构;

②需要基于理论或研究目的提出路径假设,是一种假设驱动的模型分析方法。

1 潜变量的设定

①潜变量应代表明确的抽象概念,而非随意组合指标。指标必须能够共同反映潜变量的核心特性。例如,“水质”概念可以由 NH3N、NOx、TN、TP、pH 等指标构成。

②每个潜变量包含 3-5 个指标较为合适。指标过少(1-2 个)会削弱潜变量的解释力,而指标过多可能增加噪声,影响模型稳定性。如果指标较多,可考虑进一步划分潜变量,但应确保每个指标有意义。

2 路径的假设

  1. 需明确哪个潜变量作为自变量(影响因素),哪个潜变量作为因变量(被解释变量),如 A → B。不同软件或编程语言对方向的定义略有差异,R 中箭头所指即为因变量。
  2. 验证性研究——你的假设有理论或前人研究支撑,按照前人的假设。
  3. 探索性研究——前人研究很少或没有,你可以根据研究目的提出假设,然后做出模型后验证。

3 分析实例

在示例数据中,定义了四个潜变量:

Water quality:NOx、TN、TP、PO、DOC

Biodiversity:Shannon、Simpson、Chao

DOM Categories:Ami、Car、Lig、Lip、Pro

DOM Traits:HC、OC、NC、SC、SN(图1)。

路径假设如下:

水质(Waterquality)会直接影响生物多样性(Biodiversity);

生物多样性会一步影响 DOM 分类(DOMCategories)和 DOM 特征(DOMTraits)。

DOM 分类又会影响 DOM 特征。

模型输出包括三个部分:路径模型图、载荷可视化图以及结果文档,下面逐一介绍。

  1. 路径模型图(外部模型):变量之间箭头的指向和我们假设的一样,红色代表正影响,蓝色代表负影响,跟箭头上的系数符号是对应的。这是R的原始出图,十分粗糙,这里就先不优化。主要关注路径的方向以及是否显著(看p值,在结果文档里)、变量的R方(在结果文档里)。(图2)
  2. 载荷可视化图(内部模型):展示各观测指标在其所属潜变量上的标准化载荷大小,载荷值可以为正或负,正值表示该指标与潜变量正相关,负值表示反相关。载荷的绝对值越接近 1,说明该指标与潜变量的相关性越强、解释力越好。一般来说,载荷绝对值低于 0.7 的指标需要结合理论判断是否保留。本图按潜变量分组显示,方便观察每个潜变量的核心指标及其重要性。(图3)

文档结果:结果太多,只挑重要部分展示(图4)。①模型整体拟合指标(Goodness-of-Fit, GOF),这个可以看做整体的R方了,上限是1;②指标载荷的具体值;③潜变量之间的路径是否显著也就是关注p值;④变量的R方;⑤效应量,包括直接效应、中介效应和总效应。

      

4 总结与思考

PLS-SEM 与贝叶斯结构方程各有侧重:

·PLS-SEM:适合存在潜变量且以假设驱动的研究场景;

·贝叶斯结构方程:适合数据驱动、探索潜在因果关系的分析。

掌握这两类方法后,在处理多变量、因果或路径分析研究时,可以根据数据特点与研究需求灵活选择。对于一般的多变量研究,这两类结构方程均为常用且有效的分析方案。

TomatoSCI数据分析平台,陪你过完最后一关!✅冗余分析一键完成 ✅ 免登录 ✅ 实时专业答疑 ✅ 附参考资料。

http://www.dtcms.com/a/336357.html

相关文章:

  • bash shell 入门
  • rt-thread audio框架移植stm32 adc+dac,对接cherryusb uac,进行录音和播放
  • RTC之神奇小闹钟
  • 弱类型语言(Strong Typing)与强类型语言(Weak Typing)(描述语言对变量类型处理的严格程度)
  • 【Virtual Globe 渲染技术笔记】7 GPU 光线投射
  • 法拉第笼原理
  • Windows快捷方式添加命令行参数
  • 【备忘】superdesign如何使用?(UI设计)
  • 电脑上搭建HTTP服务器在局域网内其它客户端无法访问的解决方案
  • 钉钉退出后重新登录显示网络异常,解决方法(随手记)
  • 嵌入式LINUX——————TCP并发服务器
  • Python 设计模式详解 —— 掌握软件设计的通用解决方案
  • PWM输入捕获(测量按键按下时间、测量PWM波)
  • 25. 能否创建一个包含可变对象的不可变对象
  • YOLOV5训练自己的数据集并用自己的数据集检测
  • 2025-08-17 李沐深度学习16——目标检测
  • PAT 1068 Find More Coins
  • ACPI TABLE 方式加载device driver--以spi controller为例
  • 认识信号量机制、以及用信号量来实现进程互斥于进程同步
  • 计算机网络 TCP time_wait 状态 详解
  • VirtualBox-4.3.10-93012-Win.exe 安装教程附详细步骤(附安装包下载)
  • 为何她总在关键时“失联”?—— 解密 TCP 连接异常中断
  • TensorRT-LLM.V1.1.0rc1:Dockerfile.multi文件解读
  • LeetCode 刷题【44. 通配符匹配】
  • 多墨智能-AI一键生成工作文档/流程图/思维导图
  • 《WINDOWS 环境下32位汇编语言程序设计》第3章 使用MASM
  • Redis面试精讲 Day 23:Redis与数据库数据一致性保障
  • 什么是回表?
  • 如何解决pip安装报错ModuleNotFoundError: No module named ‘scikit-image’问题
  • Hooks useState的使用