【论文调研】NASA任务负荷指数(NASA-TLX)V1.0 总结
原文链接:NASA TASK LOAD INDEX (TLX)
一、背景与发展
- 核心定义:NASA-TLX是一种多维度评分工具,通过对6个分量表的加权平均,生成整体工作负荷得分,旨在主观评估任务执行者的工作负荷水平,由美国国家航空航天局(NASA)艾姆斯研究中心人类绩效研究小组开发,历经3年研究,涵盖40余项实验室、模拟及飞行实验。
- 版本迭代原因:早期版本含9个分量表,存在明显缺陷——对实验操作的敏感性虽优于其他主流方法和单一维度工作负荷评分,但仍未达理想标准;9个分量表数量过多,在模拟或实际操作环境中实用性低;部分分量表与工作负荷无关(如疲劳)或存在冗余(如压力与挫折感)。
- 当前维度构成:新版筛选并优化出6个分量表,分为两类。一类是任务对执行者的需求维度,包括心理需求(Mental Demands)、生理需求(Physical Demands)、时间需求(Temporal Demands);另一类是执行者与任务的交互维度,包含自身表现(Own Performance)、努力程度(Effort)、挫折感(Frustration)。
二、核心构成与操作逻辑
(一)两大核心评估环节
- 负荷来源(权重设定,WEIGHTS)
- 评估方式:通过15组6个分量表的两两对比,让受试者选择每组中对任务工作负荷贡献更大的分量表。
- 权重计算:计算机统计每个分量表被选中的次数,权重范围为0(无关)-5(比其他任何因素都重要),且不同结构的任务需单独设定权重,相似版本任务可共用权重。
- 作用:解决评分者间差异问题,既体现不同评分者对同一任务工作负荷定义的差异,也反映不同任务工作负荷来源的不同,同时还能提供任务工作负荷性质的诊断信息。
- 负荷 magnitude(评分设定,RATINGS)
- 评分方式:每个分量表以一条分为20等份的线段呈现,线段两端为双极描述词(如高/低),受试者通过键盘或鼠标在对应位置标记,评分可在任务进行中、任务段结束后或整个任务完成后收集。
- 评分场景适配:实际操作场景中,评分表或口头反馈更实用;模拟和实验室场景中,计算机化版本效率更高,同时也提供纸质版本(适用于无计算机的场景,可从NASA艾姆斯研究中心获取)。
(二)加权平均流程(COMBINE)
- 计算逻辑:将每个分量表的评分乘以该分量表对应的权重,求和后除以权重总和15,得到整体工作负荷得分。
- 灵活适配性:用户可根据实验设计,指定权重是否因受试者、实验条件、重复次数的不同而变化,确保得分计算贴合实验需求。
三、实验操作流程
(一)程序概述
- 提供程序:随附磁盘包含3个程序的Turbo Pascal源代码(.PAS)和可执行代码(.COM),分别是WEIGHTS(收集权重)、RATINGS(收集评分)、COMBINE(计算整体得分)。其中RATINGS和WEIGHTS各有两个版本,MRATINGS/MWEIGHTS适配鼠标输入,KRATINGS/KWEIGHTS适配键盘输入,实验者输入均通过键盘完成。
- 数据文件:默认数据文件DEFAULTS需与程序在同一目录,记录最近使用的文件名、受试者编号等信息;程序运行后生成3类文件,.RAT(评分数据)、.WGT(权重数据)、.WWL(原始评分+加权工作负荷得分,研究者主要使用此文件)。
(二)计算机设置
- 硬件要求:适用于IBM PC兼容机,RATINGS程序需IBM彩色图形卡(或兼容卡),鼠标版本程序适配微软鼠标;建议实验者与受试者使用独立显示器,可控制受试者显示器开关,避免受试者看到实验者设置参数的初始界面。
- 运行与终止:按常规方式运行可执行程序,任何时候按CTRL-C可终止程序,但可能生成0字节输出文件,需手动删除;实验者输入信息后需按回车键确认。
(三)数据输入规范
- 必填信息:每次收集评分或权重,需输入4类信息,包括数据文件名(最长8-10个字符,程序自动添加扩展名)、1-2位受试者编号(无字母)、3位条件代码/标签(如EX1)、1-2位重复次数。
- 默认值与修改:DEFAULTS文件存储最近使用的信息,程序运行时会询问是否复用,如需修改可直接输入新信息;同一组合(文件名、受试者编号、条件、重复次数)不可重复使用,需为每次试验提供唯一标识;输入错误时,可在当前行修改或按CTRL-C退出。
(四)受试者操作指引
- 评分收集(RATINGS)
- 前期准备:受试者需阅读分量表定义(附录A)和操作说明,附录B提供评分量表示例用于讲解;通过完成少量任务练习使用评分量表,确保掌握统一评分方法。
- 程序使用:实验者完成初始数据输入后,6个分量表将显示在受试者显示器上。键盘版本用左右箭头移动指针,上箭头停止,下箭头确认;鼠标版本用鼠标移动指针,按任意按钮确认,且指针必须移动后才能标记,标记位置以箭头尖端为准,用竖线指示。
- 权重收集(WEIGHTS)
- 评估时机:对实验中结构相同的任务组(难度可不同),受试者完成一次“工作负荷来源评估”,需在接触相关任务条件后进行。
- 操作方式:实验者输入初始数据后,15组分量表标题以随机顺序显示。键盘版本按“1”选择上方标题,“2”选择下方标题,退格键取消,回车键确认;鼠标版本按左键选上方标题,右键选下方标题,指针显示选中项,再次按同一按钮确认,若需修改,按另一按钮取消原选择后重新操作。
四、数据分析流程
(一)COMBINE程序功能
- 数据处理:读取指定.RAT文件中的6个分量表原始评分,应用.RAT文件中的权重,生成.WWL文件,包含受试者编号、条件代码、重复次数等标识信息、原始评分及加权工作负荷得分。
- 文件格式:.WWL文件前3行需跳过,从第4行开始,每行前12个字符为3个标识(各4个字符),后7个整数分别为6个原始权重和加权工作负荷得分,便于导入数据分析程序。
(二)程序操作步骤
- 输入评分文件名(无需扩展名,文件不存在会提示错误)。
- 输入需应用的权重文件名(文件不存在会提示错误)。
- 输入新生成的.WWL文件名(程序自动添加扩展名,若文件已存在会提示,避免覆盖)。
- 回答权重是否因受试者、条件、重复次数变化(通常权重因受试者变化,不因重复次数变化,是否因条件变化需根据实验设计确定)。
- 生成的.WWL文件中,评分可作为因变量用于各类数据分析。
五、附录关键内容
(一)附录A:评分量表定义

| 分量表 | 端点描述 | 具体说明 |
|---|---|---|
| 心理需求(MENTAL DEMAND) | 低/高 | 所需的心理和感知活动量(如思考、决策、计算、记忆、观察、搜索等),评估任务难易、复杂程度、严谨程度 |
| 生理需求(PHYSICAL DEMAND) | 低/高 | 所需的身体活动量(如推、拉、转动、控制、启动等),评估任务难易、节奏快慢、强度大小、劳累程度 |
| 时间需求(TEMPORAL DEMAND) | 低/高 | 因任务或任务元素发生的速度/节奏产生的时间压力,评估节奏是否缓慢轻松或快速紧张 |
| 努力程度(EFFORT) | 低/高 | 为达到特定表现水平,在心理和生理上所需付出的努力程度 |
| 自身表现(PERFORMANCE) | 好/差 | 在完成实验者(或自身)设定的任务目标方面的成功程度,以及对自身表现的满意度 |
| 挫折感(FRUSTRATION LEVEL) | 低/高 | 任务过程中的情绪状态,如不安、沮丧、烦躁、紧张、恼怒与安心、满足、平静、从容的对比 |
(二)附录B:评分量表样式

每个分量表以水平线段呈现,线段两端标注端点描述,具体如下:
- 心理需求:左“Low”,右“High”
- 生理需求:左“Low”,右“High”
- 时间需求:左“Low”,右“High”
- 自身表现:左“Good”,右“Poor”
- 努力程度:左“Low”,右“High”
- 挫折感:左“Low”,右“High”
六、参考文献与联系信息
- 参考文献:包含16篇相关研究文献,涵盖心理工作负荷测量、飞行员工作负荷评估、不同任务场景下工作负荷与绩效关系等主题,如Biferno(1985)的《心理工作负荷测量:事件相关电位与工作负荷及疲劳评分》、Hart & Staveland(待发表)的《多维度工作负荷评分量表的开发:实证与理论研究结果》等,为NASA-TLX的有效性和科学性提供支撑。
- 联系信息:NASA艾姆斯研究中心,地址为加利福尼亚州莫菲特场,联系电话(415)694-6072,欢迎研究者反馈使用意见和建议,该工具仍在持续评估与优化中。
