当前位置: 首页 > news >正文

离线视频ocr识别

sudo apt-get install libleptonica-dev libtesseract-dev
sudo apt-get install tesseract-ocr-chi-sim
python -m pip  install video-ocr

windows安装方法:
下载安装
https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w64-setup-5.3.3.20231005.exe

下载

wget https://github.com/simonflueckiger/tesserocr-windows_build/releases/download/tesserocr-v2.6.0-tesseract-5.3.1/tesserocr-2.6.0-cp311-cp311-win_amd64.whl
pip install tesserocr-2.6.0-cp311-cp311-win_amd64.whl
git clone https://github.com/PinkFloyded/video-ocr.git
cd video-ocr
notepad setup.py

去掉版本依赖,修改如下:

 install_requires=[
        "tesserocr",
        "scipy",
        "opencv-python",
        "numpy",
        "tqdm",
        "click",
        "Pillow",
    ],

之后安装

python setup.py install

如果遇到

RuntimeError: Failed to init API, possibly an invalid tessdata path: ./

则需要设置环境变量TESSDATA_PREFIX为C:\Program Files\Tesseract-OCR\tessdata\

默认只能识别英文,所以要把包改掉

查看默认位置:

Python 3.10.12 (main, Jun 11 2023, 05:26:28) [GCC 11.4.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import video_ocr
>>> video_ocr.__file__
'/home/catcatyu/.local/lib/python3.10/site-packages/video_ocr.py'
>>>
nano /home/catcatyu/.local/lib/python3.10/site-packages/video_ocr.py

修改124行添加lang=chi_sim 参数。

def _ocr(frame):
    pil_image = Image.fromarray(frame.image)
    text = tesserocr.image_to_text(pil_image,lang="chi_sim") #这行
    frame.text = text
    pbar.update()
    return frame

之后使用

video-ocr --sample_rate 10  1.mp4

即可识别。
效果:

在这里插入图片描述
在这里插入图片描述

使用--sample_rate 参数可以提高精度数字越大越好

相关文章:

  • Django框架
  • Oracle Unifier 22.12 ~ 23.10 功能改进清单表
  • excel表的筛选后自动求和
  • 【解决问题】---- 解决 avue-crud 表格勾选数据翻页后界面保持选中
  • Springboot通过ObjectMapper(节点树)解析JSON
  • golang 2018,go 1.19安装Gin
  • 爬虫项目(13):使用lxml抓取相亲信息
  • 数据结构线性表——栈
  • PlayCanvas通过IFrame嵌入页面如何与canvasplay脚本通讯
  • 安防监控EasyCVR视频汇聚平台无法接入Ehome5.0是什么原因?该如何解决?
  • Linux--gcc/g++
  • 【机试题】编写一个Java函数,实现批量获取数据的功能
  • 【nlp】1.4 文本特征处理(n-gram特征、文本长度规范:补齐与截断)
  • 卷积操作中的padding和strides
  • Sprint Boot 学习路线 6
  • Socket网络编程
  • 通讯协议学习之路(实践部分):SPI开发实践
  • hadoop
  • C/C++数据结构之链表题目答案与解析
  • Apipost IDEA插件如何使用
  • 美国考虑让移民上真人秀竞逐公民权,制片人称非现实版《饥饿游戏》
  • 浙江一家长称小学老师打孩子还威胁要从3楼扔下,当地警方已立案
  • 蒲慕明院士:未来数十年不是AI取代人,而是会用AI的人取代不会用的
  • 专访|《内沙》导演杨弋枢:挽留终将失去的美好
  • 海昏侯博物馆展览上新,“西汉帝陵文化展”将持续展出3个月
  • 乌克兰官员与法德英美四国官员举行会谈