当前位置：首页 > news >正文

教程：批量提取图片pdf固定位置文字然后保存为新的文件名，基于Python和阿里云的实现方案

news 2025/11/5 4:41:24

一、项目背景

在实际工作和生活中，存在大量需要对图片或 PDF 进行批量处理的场景。例如，在档案管理中，工作人员可能会扫描大量文件，生成图片或 PDF 格式的档案资料。这些资料通常包含特定位置的关键信息，如文件编号、日期等。通过批量提取这些关键信息并将其作为文件名，可以方便后续的检索和管理。在金融行业，银行可能会收到大量客户的合同文件，这些文件以图片或 PDF 形式保存，通过提取合同编号等关键信息来重命名文件，能提高文件管理的效率。

二、界面设计

可以设计一个简单的图形用户界面（GUI），使用 Python 的 tkinter 库来实现。界面包含以下元素：

文件选择按钮：点击后弹出文件选择对话框，允许用户选择要处理的图片或 PDF 文件。
位置输入框：用于输入要提取文字的固定位置，格式可以是 x,y,width,height，表示矩形区域的左上角坐标和宽高。
阿里云配置输入框：输入阿里云 OCR 服务的 AccessKey ID 和 AccessKey Secret。
处理按钮：点击后开始对选择的文件进行处理。
进度条：显示处理进度。
日志文本框：显示处理过程中的日志信息，如成功提取的文字、重命名的文件名等。

三、详细代码步骤

1. 安装必要的库

需要安装 aliyun-python-sdk-core、aliyun-python-sdk-ocr、

http://www.dtcms.com/a/137240.html

相关文章：

大数据面试问答-HBase/ClickHouse

javaSE.走进泛型. 泛型类

wpf ScaleTransform

DeepSeek大模型微调技术PEFT与LoRA详解

大模型落地的关键：如何用 RAG 打造更智能的 AI 搜索——阿里云 AI 搜索开放平台

高等数学A1 期末救济（导数）

Vue3 SSR异构渲染引擎：混合现实与时空折叠

macOS取证分析——Safari浏览器、Apple Mail数据和Recents数据库

杰弗里·辛顿：深度学习教父

Ubuntu服务器性能调优指南：从基础工具到系统稳定性提升

算法升级战报：亚马逊受众定向工具实测点击成本降37%

vivado 时钟IP核（MMCM PLL）

MAC-批量任务并行处理实现

display的一些学习记录

无人机遥感与传统卫星遥感：谁更适合你的需求？

mysql备份存储过程、函数和事件

无人机故障冗余设计技术要点与难点！

RISC-V架构新生态：鸿道Intewell操作系统×全志D1芯片

【Mac-ML-DL】深度学习使用MPS出现内存泄露（leaked semaphore）以及张量转换错误

算法——希尔排序

【软考】论devops在企业信息系统开发中的应用

Vue基础(4)_事件处理

nvme nvme0: controller is down； will reset: CSTS=0x3, PCI_STATUS=0x10

Java Collection(7)——Iterable接口

基于YOLOV11的道路坑洼分析系统

解锁 QuickAPI 数据 API 的多元应用：高效数据交互之道

Go语言入门到入土——一、安装和Hello World

python celery 和 rabbitmq结合

嵌入式Linux驱动——6 Pinctrl和GPIO子系统

多角度分析Vue3 nextTick() 函数