【lua】二进制数据打包和解析
▒ 目录 ▒
- 🛫 导读
- 需求
- 1️⃣ 基础概念:什么是二进制打包/解析?
- 1.1 控制符(字节序与对齐方式)
- 1.2 类型符(数据类型定义)
- 2️⃣ 基础使用:string.pack 与 string.unpack 示例
- 2.1 string.pack:打包Lua值为二进制字符串
- 2.2 string.unpack:从二进制字符串解析Lua值
- 3️⃣ CE中的实际应用:内存数据读写与解析
- 3.1 构造二进制数据并写入游戏内存
- 3.2 解析游戏内存中的角色属性结构体
- 3.3 CE应用注意事项
- 🛬 文章小结
- 📖 参考资料
🛫 导读
需求
在Lua开发(尤其是Cheat Engine/游戏内存操作场景)中,经常需要处理二进制数据(如内存中的结构体、网络数据包、文件二进制内容等)。
string.pack
和string.unpack
是Lua 5.3+引入的核心函数,分别用于将多个Lua值“打包”为紧凑的二进制字符串,以及从二进制字符串中“解析”出原始Lua值。
本文需满足两类需求:1. 掌握pack/unpack
的基础语法、格式符规则及对齐逻辑;2. 结合Cheat Engine(CE)实际场景,实现内存数据解析(如读取游戏角色属性)、二进制数据构造(如写入自定义内存数据),解决CE中“结构化操作二进制数据”的核心问题。
版本号 | 描述 | |
---|---|---|
文章日期 | 2025-08-30 | |
IDE | https://www.mycompiler.io/new/lua | 5.3 |
1️⃣ 基础概念:什么是二进制打包/解析?
二进制数据是计算机底层存储、传输的核心格式(如内存、文件、网络流),其特点是“紧凑”(无文本格式的冗余)、“类型关联”(每个字节对应特定数据类型)。
Lua中默认的字符串是“文本安全”的(可存储任意字节,包括\0),string.pack
和string.unpack
正是连接“Lua高层值”(如数字、字符串)与“底层二进制数据”的桥梁:
- 打包(pack):将多个分散的Lua值(如int、float、字符串)按指定格式合并为1个二进制字符串,便于写入内存/文件。
- 解析(unpack):从二进制字符串中,按预设格式提取出原始Lua值,便于读取内存/文件中的结构化数据。
1.1 控制符(字节序与对齐方式)
控制符用于定义整体字节序和对齐规则,需放在格式符字符串开头,影响后续所有类型符:
控制符 含义说明 CE场景适用性 <
强制小端字节序(Little-endian) 首选,Windows游戏内存默认小端 >
强制大端字节序(Big-endian) 少见,多用于网络协议或特定硬件数据 =
使用当前平台原生字节序(如x86/x64为小端) 兼容平台相关数据,需确认目标平台 ![n]
设置最大对齐字节数为n(n为整数,如 !4
表示4字节对齐),默认使用原生对齐解析结构体时需匹配内存对齐(如游戏结构体按4字节对齐) (空格)
忽略,仅用于格式符可读性分割(如 "< i[4] f"
与"<i[4]f"
等价)推荐使用,提高格式符可读性
1.2 类型符(数据类型定义)
类型符用于定义具体数据类型,需与控制符配合使用。以下为CE场景高频使用的类型符(按使用频率排序):
类型符 数据类型描述 字节数 符号性 CE场景典型用途 b
带符号字节(char) 1 有符号 存储状态标记(如0=禁用,1=启用) B
无符号字节(char) 1 无符号 存储小范围计数(如道具数量0-255) h
带符号短整数(short,平台原生大小,通常2字节) 2(x86/x64平台) 有符号 存储中等范围数值(如技能等级-32768~32767) H
无符号短整数(unsigned short,平台原生大小,通常2字节) 2(x86/x64平台) 无符号 存储非负中等数值(如物品ID 0~65535) i[n]
带符号整数,指定n字节(n=1/2/4/8,如 i[4]
表示4字节带符号整数)n(1/2/4/8) 有符号 存储指定长度的有符号数值(如血量-21亿~21亿) I[n]
无符号整数,指定n字节(n=1/2/4/8,如 I[8]
表示8字节无符号整数)n(1/2/4/8) 无符号 存储64位游戏内存地址( I[8]
)或大数值f
单精度浮点数(float,平台原生大小,通常4字节) 4(x86/x64平台) - 存储精度要求不高的小数(如移动速度1.5) d
双精度浮点数(double,平台原生大小,通常8字节) 8(x86/x64平台) - 存储高精度小数(如坐标X:12345.6789) c[n]
固定长度字符串(n字节,不足补\0,超出截断) n - 存储固定长度文本(如角色名, c[10]
表示10字节)z
零终止字符串(C风格,以\0结尾,长度可变) 字符串长度+1(含\0) - 存储游戏内动态文本(如对话、提示信息) x
填充字节(无实际数据,仅占位对齐) 1 - 结构体中对齐字节(如 x3
表示3个填充字节)Xop
空项,仅用于对齐(op为对齐规则,如 X4
表示按4字节对齐)0(仅影响对齐,不占实际字节) - 复杂结构体强制对齐(如 X4i[4]
确保int在4字节对齐位置)
2️⃣ 基础使用:string.pack 与 string.unpack 示例
先通过纯Lua示例掌握核心用法,再延伸到CE场景。所有示例基于Lua 5.3+(CE 7.0+默认集成该版本)。
2.1 string.pack:打包Lua值为二进制字符串
语法:
local bin_str = string.pack(format, v1, v2, ..., vn)
format
:格式符字符串;v1~vn
:需打包的Lua值(数量、类型需与格式符匹配);- 返回值:二进制字符串(可直接写入内存/文件)。
示例1:打包“角色基础属性”(32位血量、32位蓝量、单精度攻击力、10字节角色名)
-- 格式符:<(小端紧凑)+ i4(血量)+ i4(蓝量)+ f(攻击力)+ s10(角色名) local format = "<i4i4fc10" local hp = 12500 -- 带符号32位int local mp = 8700 -- 带符号32位int local atk = 156.5 -- 32位float local name = "Warrior" -- 字符串(不足10字节会自动用\0填充)-- 执行打包 local bin_data = string.pack(format, hp, mp, atk, name)-- 查看结果:二进制字符串长度 = 4+4+4+10 = 22字节(因用了<强制1字节对齐,无额外填充) print(#bin_data) -- 输出:22
2.2 string.unpack:从二进制字符串解析Lua值
语法:
local v1, v2, ..., vn, next_pos = string.unpack(format, bin_str, [start_pos])
format
:与打包时一致的格式符;bin_str
:待解析的二进制字符串;start_pos
:可选,起始解析位置(默认1,Lua字符串索引从1开始);- 返回值:解析出的Lua值(v1~vn) + 下一个未解析的位置(next_pos,便于解析长数据)。
示例2:解析示例1中打包的“角色基础属性”
-- 格式符:<(小端紧凑)+ i4(血量)+ i4(蓝量)+ f(攻击力)+ s10(角色名) local format = "<i4i4fc10" local hp = 12500 -- 带符号32位int local mp = 8700 -- 带符号32位int local atk = 156.5 -- 32位float local name = "Warrior" -- 字符串(不足10字节会自动用\0填充)-- 执行打包 local bin_data = string.pack(format, hp, mp, atk, name)-- 查看结果:二进制字符串长度 = 4+4+4+10 = 22字节(因用了<强制1字节对齐,无额外填充) print(#bin_data) -- 输出:22-- 执行解析 local hp, mp, atk, name, next_pos = string.unpack(format, bin_data)-- 查看解析结果 print("血量:", hp) -- 输出:血量:12500 print("蓝量:", mp) -- 输出:蓝量:8700 print("攻击力:", atk) -- 输出:攻击力:156.5 print("角色名:", name) -- 输出:角色名:Warrior(不足10字节的部分被\0填充,但Lua字符串会保留\0,需按需处理) print("下一个位置:", next_pos) -- 输出:23(因总长度22,下一个位置是23,无更多数据)
示例3:解析长数据(如多个角色属性)
-- 假设bin_data是2个角色的属性(每个22字节,总44字节) local bin_data_long = bin_data .. bin_data -- 拼接2个角色数据-- 解析第一个角色 local hp1, mp1, atk1, name1, pos = string.unpack(format, bin_data_long) -- 从pos位置解析第二个角色 local hp2, mp2, atk2, name2 = string.unpack(format, bin_data_long, pos)print("角色2血量:", hp2) -- 输出:角色2血量:12500(与第一个角色一致)
3️⃣ CE中的实际应用:内存数据读写与解析
CE的核心能力是“读写目标进程内存”,而游戏内存中大量数据以“二进制结构体”形式存储(如角色属性、道具信息)。
pack/unpack
可解决CE中“结构化操作内存数据”的痛点——无需手动计算字节偏移,直接按格式解析/构造数据。
假设某32位游戏中,角色属性结构体在内存中的布局如下(通过CE结构体查看器获取):
成员变量 类型 字节数 偏移量(从结构体起始地址开始) hp 无符号32位int 4 0 mp 无符号32位int 4 4 level 无符号16位int 2 8 speed 32位float 4 10 name 零终止字符串 可变 14
3.1 构造二进制数据并写入游戏内存
需求:修改上述角色的“移动速度”为2.5,“血量”为20000,构造二进制数据后写入内存。
ps: 测试过程中,小编是自己手动创建了一块内存!!!
实现代码(CE Lua脚本):
-- 1. 复用进程和地址(同场景1) local pid = openProcess("CalculatorApp.exe") if not pid thenprint("未找到游戏进程!")return end-- 2. 定义新的属性值 local new_hp = 20000 -- 新血量 local new_mp = 15000 -- 保持原蓝量(或从内存读取后修改) local new_level = 50 -- 保持原等级 local new_speed = 2.5 -- 新移动速度 local new_name = "Hero" -- 新角色名(零终止,pack会自动加\0)-- 3. 打包新数据(格式符同场景1) local struct_format = "<I4I4I2fz" local bin_data = string.pack(struct_format, new_hp, new_mp, new_level, new_speed, new_name)-- 4. 计算写入长度(仅写入前14字节+name长度+1(\0),避免覆盖后续内存) -- 解析打包后的name长度,计算总写入长度 local name_len = #new_name local write_len = 4 + 4 + 2 + 4 + (name_len + 1) -- I4+I4+I2+f + (name+1个\0) print(write_len, #bin_data)-- 5. 写入内存(CE函数) function writeStringArr(struct_addr, s)for i = 1, #s doprint(i, struct_addr+i, s:byte(i))writeByte(struct_addr+i-1, s:byte(i))end end local struct_addr = 0x1F7F5850000 writeStringArr(struct_addr, bin_data)
运行结果如下:
3.2 解析游戏内存中的角色属性结构体
需求:读取内存地址
0x00A1B2C3
处的角色结构体数据,并解析为Lua值。
实现代码(CE Lua脚本):
-- 1. 复用进程和地址(同场景1) local pid = openProcess("CalculatorApp.exe") if not pid thenprint("未找到游戏进程!")return endfunction readStringX(struct_addr, len)local ret = ''for i = 1, len doret = ret .. string.char(readByte(struct_addr+i-1))endreturn ret end local struct_addr = 0x1F7F5850000 local s = readStringX(struct_addr, 29+1) print(#s)-- 解析二进制数据 local struct_format = "<I4I4I2fz" local hp, mp, level, speed, name = string.unpack(struct_format, s) print(hp, mp, level, speed, name)-- 输出解析结果 print("=== 角色属性 ===") print("内存地址:0x" .. string.format("%X", struct_addr)) print("血量:", hp) print("蓝量:", mp) print("等级:", level) print("移动速度:", speed) print("角色名:", name)
3.3 CE应用注意事项
- 内存地址合法性:需确保
struct_addr
是有效内存地址(可通过CE的“指针扫描”获取动态地址,避免静态地址失效);- 格式符与内存类型严格匹配:若游戏内存中是“无符号32位int”,则必须用
I4
而非i4
,否则会解析出负数;- 字节序对齐:游戏内存(Windows平台)默认是“小端字节序”,格式符开头加
<
强制紧凑对齐,避免因自然对齐导致的偏移错误;- 零终止字符串处理:
z
格式符会自动处理\0
,但需注意读取内存时长度要足够(避免截断\0
,导致解析出乱码);- 64位游戏适配:64位游戏中内存地址是64位,需用
I8
格式符存储地址,且CE需运行在64位模式下。
🛬 文章小结
string.pack
/string.unpack
的核心是格式符,需牢记高频类型(i4/I4
/f
/z
/sN
)及对齐修饰符(<
首选);- 基础用法遵循“格式符定义结构 → pack打包 → unpack解析”的流程,需确保“打包值数量/类型”与“格式符”完全匹配;
- CE场景中,两者的核心价值是“结构化读写内存”:通过
readStringX
读二进制 →unpack
解析属性;通过pack
构造新数据 →writeStringArr
写入,替代手动计算字节偏移的繁琐操作;- 关键避坑点:字节序(小端优先)、内存地址有效性、字符串
\0
处理、64位/32位格式符区分。
📖 参考资料
- Lua 5.3 官方手册:string.pack 与 string.unpack 文档
ps: 文章中内容仅用于技术交流,请勿用于游戏作弊、破坏软件版权等违规违法行为。