当前位置: 首页 > wzjs >正文

外贸网站源码多语言微信官方商城小程序

外贸网站源码多语言,微信官方商城小程序,网站论坛怎样建设,网络推广的基本手段概述 在项目中,遇到文字识别OCR的使用场景。 然而,目前效果最好的PaddleOCR只能用百度的PaddlePaddle框架运行。 常见项目中,往往使用更普遍的Pytorch框架,单独安装PaddlePaddle不仅会让项目过于臃肿,而且可能存在冲…

概述

在项目中,遇到文字识别OCR的使用场景。

然而,目前效果最好的PaddleOCR只能用百度的PaddlePaddle框架运行。

常见项目中,往往使用更普遍的Pytorch框架,单独安装PaddlePaddle不仅会让项目过于臃肿,而且可能存在冲突问题。

在前文拆解MinerU结构时,发现其用了基于PaddleOCR2Pytorch项目转换的PaddleOCR-v4的torch版本。

于是将此部分单独提取出来,做了一些解耦优化,单独构建了一个仓库,方便和其它项目进行集成。

仓库地址:https://github.com/zstar1003/PaddleOCR-Torch-Infer

所用模型

  • 检测模型:ch_PP-OCRv4_det_infer.pth

  • 识别模型:ch_PP-OCRv4_rec_infer.pth

  • 字典文件:ppocr_keys_v1.txt

使用方法

安装依赖

  1. 安装uv包管理器

建议使用uv来管理依赖环境,若未安装uv,可通过pip进行安装:

pip install uv
  1. 创建虚拟环境
uv venv --python 3.10
  1. 激活虚拟环境
.\.venv\Scripts\activate
  1. 根据uv.lock安装依赖
uv sync

命令行参数

  • --data_path必需参数,指定输入图片路径或目录路径
  • --save_path可选参数,指定保存结果的路径或目录
  • --show_confidence可选参数,是否在结果图像中显示置信度(默认不显示)

单图片处理

python infer.py --data_path test_img/general_ocr_rec_001.png --save_path output/result.png

目录批量处理

python infer.py --data_path test_img --save_path output

识别效果展示

中文识别

英文识别

中文繁体

PP-OCRv5前瞻

PP-OCRv5简介

有意思的是,当我昨天写完准备发这篇文章时,突然看见PP-OCRv5发布(上一次发布v4在2024.02.20)。

根据官方介绍[11,PP-OCRv5的主要有以下优势:

  • 1.单模型支持5种文字类型(简体中文、繁体中文、中文拼音、英文和日文)

  • 2.支持复杂手写体识别

  • 3.比上一版本PP-OCRv4,识别精度提升13个百分点

在业务多场景高难度文字识别评估集上的评估结果

不同场景的模型准确率

PP-OCRv5模型结构

根据模型的结构配置文件,可以看出,v5和v4的算法和Head部分没有显著差异,核心是修改了Backbone的网络结构。

v4-v5架构对比图

新的PPHGNetV2_B4结构在
ppocr\modeling\backbones\rec_pphgnetv2.py

理论上,用pytorch将该backbone重新实现,就可以进行模型转换。

于是Fork了PaddleOCR2Pytorch这个仓库,尝试用Agent帮我转换了一下。

仓库地址:https://github.com/zstar1003/PaddleOCR2Pytorch

结果发现,能够转换成pth文件,但存在不少参数对齐的问题。

捣鼓了一晚上,发觉还需要投入很多精力去深入了解、精调对其参数结构,遂放弃,等高人解决。

参考

1.PP-OCRv5官方文档:https://github.com/PaddlePaddle/PaddleOCR/blob/main/docs/version3.x/algorithm/PP-OCRv5/PP-OCRv5.md

2.PaddleOCR: https://github.com/PaddlePaddle/PaddleOCR)

3.PaddleOCR2Pytorch: https://github.com/frotms/PaddleOCR2Pytorch

4.MinerU: https://github.com/opendatalab/MinerU

http://www.dtcms.com/wzjs/599420.html

相关文章:

  • html 单页网站网站加入地图导航
  • 手机网站开发 1433端口错误哪个网站做团购要求低点
  • 深圳建设一个网站制作公司18+网站推广
  • 个人备案网站可以做淘宝客南京关键词网站排名
  • 为什么做旅游网站企业信用信息查询系统官网(全国)
  • 翻页大图网站网站地图 百度
  • 怎么样在公司配置服务器做网站商场设计师
  • 网站建设升级的必要性会计公司网站样式
  • 网站建设职位要求网店运营推广平台
  • 做网站那家好什么是网络营销的核心工作
  • 网站容易做吗仙桃网站定制
  • 如何做兼职网站平台莱芜信息网莱芜在线
  • 关于网站开发人员的薪资重庆网站建站价格
  • 怎么制作网站logo网站展示型广告案例解析
  • 网站开发技术期末考试题网站规划建设实训报告书
  • 淘宝客网站需要多大空间网站建设公司需要申请icp吗
  • 三门峡市住房建设局网站淄博电商网站建设
  • 辽宁建网站政务网站建设办法
  • 购买网站wordpress文本块
  • qq代刷网站推广ui设计师怎么做自己的网站
  • 音酷网站建设一家专做特卖的网站
  • 如何进入设计公司网站有没有做外贸的网站啊
  • 怎样辨别网站网站建设需要提供的资料
  • 全国旅游大型网站建设四川成都住建局官网
  • 云浮 网站建设2014网站建设
  • 那个做网站好凡科企业邮箱登录入口
  • 小米手机的网站架构企业负责人电话名录
  • 百度网站做防水补漏叮当app制作
  • .net网站制作重庆seo标准
  • 关于公示网站建设的计划书wordpress新文章数据库