当前位置：首页 > news >正文

【论文调研】NASA任务负荷指数（NASA-TLX）V1.0 总结

news 2025/11/11 11:50:31

原文链接：NASA TASK LOAD INDEX (TLX)

一、背景与发展

核心定义：NASA-TLX是一种多维度评分工具，通过对6个分量表的加权平均，生成整体工作负荷得分，旨在主观评估任务执行者的工作负荷水平，由美国国家航空航天局（NASA）艾姆斯研究中心人类绩效研究小组开发，历经3年研究，涵盖40余项实验室、模拟及飞行实验。
版本迭代原因：早期版本含9个分量表，存在明显缺陷——对实验操作的敏感性虽优于其他主流方法和单一维度工作负荷评分，但仍未达理想标准；9个分量表数量过多，在模拟或实际操作环境中实用性低；部分分量表与工作负荷无关（如疲劳）或存在冗余（如压力与挫折感）。
当前维度构成：新版筛选并优化出6个分量表，分为两类。一类是任务对执行者的需求维度，包括心理需求（Mental Demands）、生理需求（Physical Demands）、时间需求（Temporal Demands）；另一类是执行者与任务的交互维度，包含自身表现（Own Performance）、努力程度（Effort）、挫折感（Frustration）。

二、核心构成与操作逻辑

（一）两大核心评估环节

负荷来源（权重设定，WEIGHTS）
- 评估方式：通过15组6个分量表的两两对比，让受试者选择每组中对任务工作负荷贡献更大的分量表。
- 权重计算：计算机统计每个分量表被选中的次数，权重范围为0（无关）-5（比其他任何因素都重要），且不同结构的任务需单独设定权重，相似版本任务可共用权重。
- 作用：解决评分者间差异问题，既体现不同评分者对同一任务工作负荷定义的差异，也反映不同任务工作负荷来源的不同，同时还能提供任务工作负荷性质的诊断信息。
负荷 magnitude（评分设定，RATINGS）
- 评分方式：每个分量表以一条分为20等份的线段呈现，线段两端为双极描述词（如高/低），受试者通过键盘或鼠标在对应位置标记，评分可在任务进行中、任务段结束后或整个任务完成后收集。
- 评分场景适配：实际操作场景中，评分表或口头反馈更实用；模拟和实验室场景中，计算机化版本效率更高，同时也提供纸质版本（适用于无计算机的场景，可从NASA艾姆斯研究中心获取）。

（二）加权平均流程（COMBINE）

计算逻辑：将每个分量表的评分乘以该分量表对应的权重，求和后除以权重总和15，得到整体工作负荷得分。
灵活适配性：用户可根据实验设计，指定权重是否因受试者、实验条件、重复次数的不同而变化，确保得分计算贴合实验需求。

三、实验操作流程

（一）程序概述

提供程序：随附磁盘包含3个程序的Turbo Pascal源代码（.PAS）和可执行代码（.COM），分别是WEIGHTS（收集权重）、RATINGS（收集评分）、COMBINE（计算整体得分）。其中RATINGS和WEIGHTS各有两个版本，MRATINGS/MWEIGHTS适配鼠标输入，KRATINGS/KWEIGHTS适配键盘输入，实验者输入均通过键盘完成。
数据文件：默认数据文件DEFAULTS需与程序在同一目录，记录最近使用的文件名、受试者编号等信息；程序运行后生成3类文件，.RAT（评分数据）、.WGT（权重数据）、.WWL（原始评分+加权工作负荷得分，研究者主要使用此文件）。

（二）计算机设置

硬件要求：适用于IBM PC兼容机，RATINGS程序需IBM彩色图形卡（或兼容卡），鼠标版本程序适配微软鼠标；建议实验者与受试者使用独立显示器，可控制受试者显示器开关，避免受试者看到实验者设置参数的初始界面。
运行与终止：按常规方式运行可执行程序，任何时候按CTRL-C可终止程序，但可能生成0字节输出文件，需手动删除；实验者输入信息后需按回车键确认。

（三）数据输入规范

必填信息：每次收集评分或权重，需输入4类信息，包括数据文件名（最长8-10个字符，程序自动添加扩展名）、1-2位受试者编号（无字母）、3位条件代码/标签（如EX1）、1-2位重复次数。
默认值与修改：DEFAULTS文件存储最近使用的信息，程序运行时会询问是否复用，如需修改可直接输入新信息；同一组合（文件名、受试者编号、条件、重复次数）不可重复使用，需为每次试验提供唯一标识；输入错误时，可在当前行修改或按CTRL-C退出。

（四）受试者操作指引

评分收集（RATINGS）
- 前期准备：受试者需阅读分量表定义（附录A）和操作说明，附录B提供评分量表示例用于讲解；通过完成少量任务练习使用评分量表，确保掌握统一评分方法。
- 程序使用：实验者完成初始数据输入后，6个分量表将显示在受试者显示器上。键盘版本用左右箭头移动指针，上箭头停止，下箭头确认；鼠标版本用鼠标移动指针，按任意按钮确认，且指针必须移动后才能标记，标记位置以箭头尖端为准，用竖线指示。
权重收集（WEIGHTS）
- 评估时机：对实验中结构相同的任务组（难度可不同），受试者完成一次“工作负荷来源评估”，需在接触相关任务条件后进行。
- 操作方式：实验者输入初始数据后，15组分量表标题以随机顺序显示。键盘版本按“1”选择上方标题，“2”选择下方标题，退格键取消，回车键确认；鼠标版本按左键选上方标题，右键选下方标题，指针显示选中项，再次按同一按钮确认，若需修改，按另一按钮取消原选择后重新操作。

四、数据分析流程

（一）COMBINE程序功能

数据处理：读取指定.RAT文件中的6个分量表原始评分，应用.RAT文件中的权重，生成.WWL文件，包含受试者编号、条件代码、重复次数等标识信息、原始评分及加权工作负荷得分。
文件格式：.WWL文件前3行需跳过，从第4行开始，每行前12个字符为3个标识（各4个字符），后7个整数分别为6个原始权重和加权工作负荷得分，便于导入数据分析程序。

（二）程序操作步骤

输入评分文件名（无需扩展名，文件不存在会提示错误）。
输入需应用的权重文件名（文件不存在会提示错误）。
输入新生成的.WWL文件名（程序自动添加扩展名，若文件已存在会提示，避免覆盖）。
回答权重是否因受试者、条件、重复次数变化（通常权重因受试者变化，不因重复次数变化，是否因条件变化需根据实验设计确定）。
生成的.WWL文件中，评分可作为因变量用于各类数据分析。

五、附录关键内容

（一）附录A：评分量表定义

NASA TLX 表 A

分量表	端点描述	具体说明
心理需求（MENTAL DEMAND）	低/高	所需的心理和感知活动量（如思考、决策、计算、记忆、观察、搜索等），评估任务难易、复杂程度、严谨程度
生理需求（PHYSICAL DEMAND）	低/高	所需的身体活动量（如推、拉、转动、控制、启动等），评估任务难易、节奏快慢、强度大小、劳累程度
时间需求（TEMPORAL DEMAND）	低/高	因任务或任务元素发生的速度/节奏产生的时间压力，评估节奏是否缓慢轻松或快速紧张
努力程度（EFFORT）	低/高	为达到特定表现水平，在心理和生理上所需付出的努力程度
自身表现（PERFORMANCE）	好/差	在完成实验者（或自身）设定的任务目标方面的成功程度，以及对自身表现的满意度
挫折感（FRUSTRATION LEVEL）	低/高	任务过程中的情绪状态，如不安、沮丧、烦躁、紧张、恼怒与安心、满足、平静、从容的对比

（二）附录B：评分量表样式

NASA TLX 表 B

每个分量表以水平线段呈现，线段两端标注端点描述，具体如下：

心理需求：左“Low”，右“High”
生理需求：左“Low”，右“High”
时间需求：左“Low”，右“High”
自身表现：左“Good”，右“Poor”
努力程度：左“Low”，右“High”
挫折感：左“Low”，右“High”

六、参考文献与联系信息

参考文献：包含16篇相关研究文献，涵盖心理工作负荷测量、飞行员工作负荷评估、不同任务场景下工作负荷与绩效关系等主题，如Biferno（1985）的《心理工作负荷测量：事件相关电位与工作负荷及疲劳评分》、Hart & Staveland（待发表）的《多维度工作负荷评分量表的开发：实证与理论研究结果》等，为NASA-TLX的有效性和科学性提供支撑。
联系信息：NASA艾姆斯研究中心，地址为加利福尼亚州莫菲特场，联系电话（415）694-6072，欢迎研究者反馈使用意见和建议，该工具仍在持续评估与优化中。

查看全文

http://www.dtcms.com/a/594056.html