当前位置: 首页 > news >正文

【使用Flask基于PaddleOCR3.0开发一个接口 调用时报错RuntimeError: std::exception】

项目场景:

使用PaddleOCR3.0开发一个OCR接口,使用Flask封装成接口使用


问题描述

使用Flask基于PaddleOCR3.0 CPU模式开发了一个接口, 每次调用接口就会调用一次ocr.predict(path)方法。
在调试的过程中发现每次调用的第一次可以正常返回, 然后第二次就会提示:RuntimeError: std::exception。然后后续又可以…以此类推。

当前代码的实现方式是建了一个全局的OCR引擎,然后在项目启动的时候初始化

在这里插入图片描述


原因分析:

首先既然存在好用的情况,那核心代码应该是没问题的。
后面考虑是不是多线程导致的问题,因为我的Flask开了多线程
在这里插入图片描述

后面在查询资料时看到了PaddleOCR中的Issues中有人有相同的问题,链接如下:
https://github.com/PaddlePaddle/PaddleOCR/issues/15621

大致原因也是多线程引起的问题

我们观察到使用paddle+mkldnn时,有两种情况可能会遇到类似的问题:
1.多线程同时操作一个predictor;
2.在非主线程中操作全局predictor。
第一种情况是因为paddle inference不被设计为线程安全的,应用代码不应该假设其线程安全性,使用类似动态图的方式来做并行推理,所以可能需要加锁或者创建多个实例控制并发;第二种情况考虑是paddle inference的bug,目前暂时没有简单的解决办法,建议可以考虑维护一个线程池,并在每个线程中创建单独的predictor


解决方案:

方案一:修改Flask的多线程配置,取消多线程设置

在这里插入图片描述
这个方法我修改后测试过,确实是可以解决这个问题。但是之前启用多线程就是考虑性能方面。所以我没有选择该方案

方案二:根据Issues中的建议,加锁或者用线程池(我选择的是使用线程池的方式)

首先取消设置全局OCR引擎,新增获取OCR引擎方法:

# 线程本地存储,确保每个线程有自己的OCR引擎实例
thread_local = threading.local()
def get_ocr_engine():"""获取当前线程的OCR引擎实例,如果不存在则创建新的"""if not hasattr(thread_local, "ocr_engine"):logger.info(f"正在为线程 {threading.get_ident()} 初始化PaddleOCR模型,首次使用时可能需要1-3分钟...")try:thread_local.ocr_engine = PaddleOCR(use_doc_orientation_classify=False,use_doc_unwarping=False,use_textline_orientation=False,device='cpu')logger.info(f"✅ 线程 {threading.get_ident()} 的OCR引擎初始化成功!")except Exception as e:logger.error(f"❌ OCR引擎初始化失败: {str(e)}")logger.error(traceback.format_exc())raise RuntimeError("模型初始化失败") from ereturn thread_local.ocr_engine

然后修改执行OCR的方法

def perform_ocr(image):"""对图像进行OCR识别"""try:# 获取当前线程的OCR引擎ocr_engine = get_ocr_engine()# 新版PaddleOCR调用方式result = ocr_engine.predict(image)return resultexcept Exception as e:logger.error(f"OCR处理异常: {str(e)}", exc_info=True)raise RuntimeError("OCR处理失败") from e

之前是直接用全局的OCR引擎调用predict方法,修改后从自己的线程中获取OCR引擎,没有则创建

http://www.dtcms.com/a/271486.html

相关文章:

  • JVM调优实战指南:让Java程序性能飞升的奥秘
  • PanTS: The Pancreatic Tumor Segmentation Dataset
  • 使用anaconda创建基础环境
  • 数据分析框架和方法
  • 数据分析-名词
  • pip 安装加速指南:配置国内镜像源(中国科技大学、清华、阿里云等)
  • Java武林:虚拟机之道 第七章:秘籍解析 - JVM调优参数
  • 经验分享-没有xcode也可以上传App Store Connect
  • S7-1500——(一)从入门到精通1、基于TIA 博途解析PLC程序结构(一)
  • c语言中的数组II
  • 景观桥 涵洞 城门等遮挡物对汽车安全性的影响数学建模和计算方法,需要收集那些数据
  • 周立功汽车软件ZXDoc深度解析:新能源汽车开发新基建的破局之道
  • java 语法类新特性总结
  • 【王树森推荐系统】排序05:排序模型的特征
  • 计蒜客T3473丑数、Leetcode2401最长优雅子数组、Leetcode167两数之和、Leetcode581最短无序连续子数组
  • 深度帖:浏览器的事件循环与JS异步
  • 【教程】基于GNN的药物相互作用网络中的链接预测
  • 数据一致性解决方案总结
  • Linux驱动04 --- 网络编程TCP客户端
  • 暑假读书笔记第五天
  • 深入剖析Elasticsearch倒排索引,Query DSL查询使用场景分析
  • lwip+8720+裸机+先上电在插网线 ping不同
  • HashMap的get、put流程源码分析
  • jenkins+固定agent节点+maven+sonarqube+docker
  • uniapp小程序无感刷新token
  • 数据结构之位图和布隆过滤器
  • ReactNative【实战系列教程】我的小红书 5 -- 文章详情(含轮播图 ImageSlider,点亮红心动画 Heart,嵌套评论等)
  • 【三维重建】一、设备分类
  • 优化 ECharts 多条折线:折线数据不完整导致的X轴日期错乱问题
  • 【面试精讲】I2C 子系统核心结构与常见问题深度解析