PaddleX服务化部署精度低于命令行调用的原因及解决方案
问题描述
启动paddlex的docker镜像容器后,进入到容器内部,发送正确的请求到http://localhost:8000/v2/models/layout-parsing/infer地址中,解析 https://XXXXXXX.com/img/pdf-word-test.pdf这个文件,得到的解析结果,其精度不如直接在容器内部使用以下命令进行解析的结果准确,是什么原因,如何解决服务化部署的精度问题呢:paddlex --pipeline PP-StructureV3
–input https://XXXXXXX.com/img/pdf-word-test.pdf
–use_doc_orientation_classify False
–use_doc_unwarping False
–use_textline_orientation False
–save_path ./output
–device gpu:0
补充说明:二者在使用过程中,调用模型时,看到后台打印的日志内容是一致的
PaddleX服务化部署精度低于命令行调用的原因及解决方案
在使用PaddleX的Docker容器时,您观察到通过HTTP服务请求对PDF文件进行版面分析的精度,低于直接在容器内使用命令行进行解析的精度。尽管后台日志看似一致,但二者之间确实存在关键差异,这主要源于默认参数配置不同。
问题根源:默认参数的差异
-
命令行调用:
在您使用的命令中,通过添加参数明确地禁用了三个预处理步骤:--use_doc_orientation_classify False
:禁止文档方向分类,即不自动旋转图片。--use_doc_unwarping False
:禁止文档图像矫正,即不对弯曲或变形的页面进行展平处理。 <