【工具教程】批量提取OCR图片中固定文字保存WPS表格,批量OCR识别图像中的文字保存到Excel表格的操作步骤和注意事项
在海关日常办公中,每天会接收大量来自企业的进出口报关单据,这些单据多以图片或 PDF 形式呈现,包含商品名称、HS 编码、申报金额、进出口口岸等关键信息,传统人工录入不仅耗时费力,还易因人为失误导致数据偏差,影响通关效率。
今天我们分享快速从图片或者PDF里提取区域文字组合导出表格的方法,具体操作步骤如下
一、操作步骤
- 选择模式:打开软件,根据文件类型选择 “图片识别模式” 或 “PDF 识别模式”。
- 设置识别区域:将图片或 PDF 文件拖入软件界面,用鼠标框选需要识别的区域,保存绘制区域的坐标,若有多个区域,可多次绘制并命名,这些名字将作为导出表格的列名。
- 加载文件并处理:点击 “导入图片” 或 “导入 PDF” 按钮,选择待处理文件所在文件夹,选择 “区域识别导表格” 功能,点击 “开始处理”。
- 校验结果:识别完成后,检查表格内容是否完整、正确,如有错误,可调整识别区域或重新设置参数再次处理。
二、注意事项
文件规格:该系统适用于固定大小的文档,若文件尺寸不统一,需联系技术动态锁定位置。
识别率影响因素:字体与字号方面,印刷字体识别率较高;文字清晰度、分辨率、背景复杂度等也会影响识别率,如文字有污渍、背景复杂等会降低识别准确率。