当前位置: 首页 > news >正文

【lua】二进制数据打包和解析

🛫 导读

需求

在Lua开发(尤其是Cheat Engine/游戏内存操作场景)中,经常需要处理二进制数据(如内存中的结构体、网络数据包、文件二进制内容等)。string.packstring.unpack 是Lua 5.3+引入的核心函数,分别用于将多个Lua值“打包”为紧凑的二进制字符串,以及从二进制字符串中“解析”出原始Lua值。
本文需满足两类需求:1. 掌握 pack/unpack 的基础语法、格式符规则及对齐逻辑;2. 结合Cheat Engine(CE)实际场景,实现内存数据解析(如读取游戏角色属性)、二进制数据构造(如写入自定义内存数据),解决CE中“结构化操作二进制数据”的核心问题。

版本号描述
文章日期2025-08-30
IDEhttps://www.mycompiler.io/new/lua5.3

1️⃣ 基础概念:什么是二进制打包/解析?

二进制数据是计算机底层存储、传输的核心格式(如内存、文件、网络流),其特点是“紧凑”(无文本格式的冗余)、“类型关联”(每个字节对应特定数据类型)。
Lua中默认的字符串是“文本安全”的(可存储任意字节,包括\0),string.packstring.unpack 正是连接“Lua高层值”(如数字、字符串)与“底层二进制数据”的桥梁:

  • 打包(pack):将多个分散的Lua值(如int、float、字符串)按指定格式合并为1个二进制字符串,便于写入内存/文件。
  • 解析(unpack):从二进制字符串中,按预设格式提取出原始Lua值,便于读取内存/文件中的结构化数据。

1.1 控制符(字节序与对齐方式)

控制符用于定义整体字节序和对齐规则,需放在格式符字符串开头,影响后续所有类型符:

控制符含义说明CE场景适用性
<强制小端字节序(Little-endian)首选,Windows游戏内存默认小端
>强制大端字节序(Big-endian)少见,多用于网络协议或特定硬件数据
=使用当前平台原生字节序(如x86/x64为小端)兼容平台相关数据,需确认目标平台
![n]设置最大对齐字节数为n(n为整数,如!4表示4字节对齐),默认使用原生对齐解析结构体时需匹配内存对齐(如游戏结构体按4字节对齐)
(空格)忽略,仅用于格式符可读性分割(如"< i[4] f""<i[4]f"等价)推荐使用,提高格式符可读性

1.2 类型符(数据类型定义)

类型符用于定义具体数据类型,需与控制符配合使用。以下为CE场景高频使用的类型符(按使用频率排序):

类型符数据类型描述字节数符号性CE场景典型用途
b带符号字节(char)1有符号存储状态标记(如0=禁用,1=启用)
B无符号字节(char)1无符号存储小范围计数(如道具数量0-255)
h带符号短整数(short,平台原生大小,通常2字节)2(x86/x64平台)有符号存储中等范围数值(如技能等级-32768~32767)
H无符号短整数(unsigned short,平台原生大小,通常2字节)2(x86/x64平台)无符号存储非负中等数值(如物品ID 0~65535)
i[n]带符号整数,指定n字节(n=1/2/4/8,如i[4]表示4字节带符号整数)n(1/2/4/8)有符号存储指定长度的有符号数值(如血量-21亿~21亿)
I[n]无符号整数,指定n字节(n=1/2/4/8,如I[8]表示8字节无符号整数)n(1/2/4/8)无符号存储64位游戏内存地址(I[8])或大数值
f单精度浮点数(float,平台原生大小,通常4字节)4(x86/x64平台)-存储精度要求不高的小数(如移动速度1.5)
d双精度浮点数(double,平台原生大小,通常8字节)8(x86/x64平台)-存储高精度小数(如坐标X:12345.6789)
c[n]固定长度字符串(n字节,不足补\0,超出截断)n-存储固定长度文本(如角色名,c[10]表示10字节)
z零终止字符串(C风格,以\0结尾,长度可变)字符串长度+1(含\0)-存储游戏内动态文本(如对话、提示信息)
x填充字节(无实际数据,仅占位对齐)1-结构体中对齐字节(如x3表示3个填充字节)
Xop空项,仅用于对齐(op为对齐规则,如X4表示按4字节对齐)0(仅影响对齐,不占实际字节)-复杂结构体强制对齐(如X4i[4]确保int在4字节对齐位置)

2️⃣ 基础使用:string.pack 与 string.unpack 示例

先通过纯Lua示例掌握核心用法,再延伸到CE场景。所有示例基于Lua 5.3+(CE 7.0+默认集成该版本)。

2.1 string.pack:打包Lua值为二进制字符串

语法:local bin_str = string.pack(format, v1, v2, ..., vn)

  • format:格式符字符串;
  • v1~vn:需打包的Lua值(数量、类型需与格式符匹配);
  • 返回值:二进制字符串(可直接写入内存/文件)。

示例1:打包“角色基础属性”(32位血量、32位蓝量、单精度攻击力、10字节角色名)

-- 格式符:<(小端紧凑)+ i4(血量)+ i4(蓝量)+ f(攻击力)+ s10(角色名)
local format = "<i4i4fc10"
local hp = 12500  -- 带符号32位int
local mp = 8700   -- 带符号32位int
local atk = 156.5 -- 32位float
local name = "Warrior" -- 字符串(不足10字节会自动用\0填充)-- 执行打包
local bin_data = string.pack(format, hp, mp, atk, name)-- 查看结果:二进制字符串长度 = 4+4+4+10 = 22字节(因用了<强制1字节对齐,无额外填充)
print(#bin_data) -- 输出:22

2.2 string.unpack:从二进制字符串解析Lua值

语法:local v1, v2, ..., vn, next_pos = string.unpack(format, bin_str, [start_pos])

  • format:与打包时一致的格式符;
  • bin_str:待解析的二进制字符串;
  • start_pos:可选,起始解析位置(默认1,Lua字符串索引从1开始);
  • 返回值:解析出的Lua值(v1~vn) + 下一个未解析的位置(next_pos,便于解析长数据)。

示例2:解析示例1中打包的“角色基础属性”

-- 格式符:<(小端紧凑)+ i4(血量)+ i4(蓝量)+ f(攻击力)+ s10(角色名)
local format = "<i4i4fc10"
local hp = 12500  -- 带符号32位int
local mp = 8700   -- 带符号32位int
local atk = 156.5 -- 32位float
local name = "Warrior" -- 字符串(不足10字节会自动用\0填充)-- 执行打包
local bin_data = string.pack(format, hp, mp, atk, name)-- 查看结果:二进制字符串长度 = 4+4+4+10 = 22字节(因用了<强制1字节对齐,无额外填充)
print(#bin_data) -- 输出:22-- 执行解析
local hp, mp, atk, name, next_pos = string.unpack(format, bin_data)-- 查看解析结果
print("血量:", hp)      -- 输出:血量:12500
print("蓝量:", mp)      -- 输出:蓝量:8700
print("攻击力:", atk)   -- 输出:攻击力:156.5
print("角色名:", name)  -- 输出:角色名:Warrior(不足10字节的部分被\0填充,但Lua字符串会保留\0,需按需处理)
print("下一个位置:", next_pos) -- 输出:23(因总长度22,下一个位置是23,无更多数据)

示例3:解析长数据(如多个角色属性)

-- 假设bin_data是2个角色的属性(每个22字节,总44字节)
local bin_data_long = bin_data .. bin_data -- 拼接2个角色数据-- 解析第一个角色
local hp1, mp1, atk1, name1, pos = string.unpack(format, bin_data_long)
-- 从pos位置解析第二个角色
local hp2, mp2, atk2, name2 = string.unpack(format, bin_data_long, pos)print("角色2血量:", hp2) -- 输出:角色2血量:12500(与第一个角色一致)

3️⃣ CE中的实际应用:内存数据读写与解析

CE的核心能力是“读写目标进程内存”,而游戏内存中大量数据以“二进制结构体”形式存储(如角色属性、道具信息)。pack/unpack 可解决CE中“结构化操作内存数据”的痛点——无需手动计算字节偏移,直接按格式解析/构造数据。

假设某32位游戏中,角色属性结构体在内存中的布局如下(通过CE结构体查看器获取):

成员变量类型字节数偏移量(从结构体起始地址开始)
hp无符号32位int40
mp无符号32位int44
level无符号16位int28
speed32位float410
name零终止字符串可变14

3.1 构造二进制数据并写入游戏内存

需求:修改上述角色的“移动速度”为2.5,“血量”为20000,构造二进制数据后写入内存。
ps: 测试过程中,小编是自己手动创建了一块内存!!!

实现代码(CE Lua脚本):

-- 1. 复用进程和地址(同场景1)
local pid = openProcess("CalculatorApp.exe")
if not pid thenprint("未找到游戏进程!")return
end-- 2. 定义新的属性值
local new_hp = 20000    -- 新血量
local new_mp = 15000    -- 保持原蓝量(或从内存读取后修改)
local new_level = 50    -- 保持原等级
local new_speed = 2.5   -- 新移动速度
local new_name = "Hero" -- 新角色名(零终止,pack会自动加\0)-- 3. 打包新数据(格式符同场景1)
local struct_format = "<I4I4I2fz"
local bin_data = string.pack(struct_format, new_hp, new_mp, new_level, new_speed, new_name)-- 4. 计算写入长度(仅写入前14字节+name长度+1(\0),避免覆盖后续内存)
-- 解析打包后的name长度,计算总写入长度
local name_len = #new_name
local write_len = 4 + 4 + 2 + 4 + (name_len + 1) -- I4+I4+I2+f + (name+1个\0)
print(write_len, #bin_data)-- 5. 写入内存(CE函数)
function writeStringArr(struct_addr, s)for i = 1, #s doprint(i, struct_addr+i, s:byte(i))writeByte(struct_addr+i-1, s:byte(i))end
end
local struct_addr = 0x1F7F5850000
writeStringArr(struct_addr, bin_data)

运行结果如下:
在这里插入图片描述

3.2 解析游戏内存中的角色属性结构体

需求:读取内存地址 0x00A1B2C3 处的角色结构体数据,并解析为Lua值。

实现代码(CE Lua脚本):

-- 1. 复用进程和地址(同场景1)
local pid = openProcess("CalculatorApp.exe")
if not pid thenprint("未找到游戏进程!")return
endfunction readStringX(struct_addr, len)local ret = ''for i = 1, len doret = ret .. string.char(readByte(struct_addr+i-1))endreturn ret
end
local struct_addr = 0x1F7F5850000
local s = readStringX(struct_addr, 29+1)
print(#s)-- 解析二进制数据
local struct_format = "<I4I4I2fz"
local hp, mp, level, speed, name = string.unpack(struct_format, s)
print(hp, mp, level, speed, name)-- 输出解析结果
print("=== 角色属性 ===")
print("内存地址:0x" .. string.format("%X", struct_addr))
print("血量:", hp)
print("蓝量:", mp)
print("等级:", level)
print("移动速度:", speed)
print("角色名:", name)

在这里插入图片描述

3.3 CE应用注意事项

  1. 内存地址合法性:需确保 struct_addr 是有效内存地址(可通过CE的“指针扫描”获取动态地址,避免静态地址失效);
  2. 格式符与内存类型严格匹配:若游戏内存中是“无符号32位int”,则必须用 I4 而非 i4,否则会解析出负数;
  3. 字节序对齐:游戏内存(Windows平台)默认是“小端字节序”,格式符开头加 < 强制紧凑对齐,避免因自然对齐导致的偏移错误;
  4. 零终止字符串处理z 格式符会自动处理 \0,但需注意读取内存时长度要足够(避免截断 \0,导致解析出乱码);
  5. 64位游戏适配:64位游戏中内存地址是64位,需用 I8 格式符存储地址,且CE需运行在64位模式下。

🛬 文章小结

  1. string.pack/string.unpack 的核心是格式符,需牢记高频类型(i4/I4/f/z/sN)及对齐修饰符(< 首选);
  2. 基础用法遵循“格式符定义结构 → pack打包 → unpack解析”的流程,需确保“打包值数量/类型”与“格式符”完全匹配;
  3. CE场景中,两者的核心价值是“结构化读写内存”:通过 readStringX 读二进制 → unpack 解析属性;通过 pack 构造新数据 → writeStringArr 写入,替代手动计算字节偏移的繁琐操作;
  4. 关键避坑点:字节序(小端优先)、内存地址有效性、字符串 \0 处理、64位/32位格式符区分。

📖 参考资料

  • Lua 5.3 官方手册:string.pack 与 string.unpack 文档

ps: 文章中内容仅用于技术交流,请勿用于游戏作弊、破坏软件版权等违规违法行为。

http://www.dtcms.com/a/359657.html

相关文章:

  • 使用 Python 自动化检查矢量面数据的拓扑错误(含导出/删除选项)
  • 【C++ 】STL详解(六)—手撸一个属于你的 list!
  • Lua基础知识精炼
  • vscode+EIDE+Clangd环境导入keil C51以及MDK工程
  • PortSwigger靶场之Stored XSS into HTML context with nothing encoded通关秘籍
  • AG32 Nano开发板的烧录与调试工具(二)
  • LabVIEW 瀑布图与游标操作
  • Python人工智能机器学习汇总
  • MySQL 常用语法
  • CTFshow系列——命令执行web69-72
  • 贝叶斯分类(Bayes Classify)
  • 【嵌入式DIY实例】-空中鼠标
  • Ubuntu安装NVIDIA显卡驱动
  • C#基础(③CMD进程)
  • 【C2000】C2000的国产替代现状与技术关键路径
  • unity3d 中 R3 实际使用 安装方法
  • 吴恩达机器学习作业十 PCA主成分分析
  • 【量化回测】backtracker整体架构和使用示例
  • arm容器启动spring-boot端口报错
  • linux 内核 - 常见的文件系统介绍
  • 【K8s】整体认识K8s之存储--volume
  • shell脚本(略)
  • 【Flink】并行度的设置
  • nrf52840 flash 分区
  • 3【鸿蒙/OpenHarmony/NDK】如何在鸿蒙应用中使用NDK?
  • 线阵相机和镜头选型案例介绍
  • 【不懂就问】-手机相关学习
  • 打开多个Excel文件后快速关闭所有的文档,并且退出Excel应用
  • Docker一小时快速上手(附报错解决方式)
  • 并发编程——11 并发容器(Map、List、Set)实战及其原理分析